Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

No Result
View All Result
Home Νέα

Τεστ AI από Databricks & Perplexity δείχνει την ωμή αλήθεια

by Theodoros Kostogiannis
27 Ιουλίου, 2025
in Νέα
0
Το K Prize είναι ένας νέος διαγωνισμός προγραμματισμού με Τεχνητή Νοημοσύνη που διοργανώνεται από το Laude Institute, με υποστήριξη του συνιδρυτή των Databricks και Perplexity, Andy Konwinski. Ο πρώτος νικητής, Eduardo Rocha de Andrade, κέρδισε $50.000 με μόλις 7,5% σωστές απαντήσεις, γεγονός που υπογραμμίζει τη δυσκολία του τεστ.
Share on FacebookShare on Twitter

Μια νέα πρόκληση κωδικοποίησης με AI αποκαλύπτει τα πρώτα της αποτελέσματα και δεν είναι εντυπωσιακά

Μια πρόσφατη πρόκληση κωδικοποίησης με τη χρήση τεχνητής νοημοσύνης αποκάλυψε τον πρώτο της νικητή και έθεσε ένα νέο επίπεδο για τους μηχανικούς λογισμικού που βασίζονται σε AI. Η Laude Institute, ένας μη κερδοσκοπικός οργανισμός, ανακοίνωσε τον νικητή του K Prize, ενός πολυεπίπεδου διαγωνισμού κωδικοποίησης AI που ξεκίνησε από τον Andy Konwinski, συνιδρυτή των Databricks και Perplexity. Ο νικητής ήταν ο Eduardo Rocha de Andrade, ένας Βραζιλιάνος ειδικός σε prompts, ο οποίος θα λάβει $50,000 ως βραβείο. Ωστόσο, το πιο εντυπωσιακό δεν ήταν η νίκη του, αλλά η τελική του βαθμολογία: κέρδισε με σωστές απαντήσεις σε μόλις 7,5% των ερωτήσεων της δοκιμής.

Ο Konwinski εξέφρασε την ικανοποίησή του για τη δημιουργία ενός δύσκολου σημείου αναφοράς, υπογραμμίζοντας ότι τα σημεία αναφοράς πρέπει να είναι απαιτητικά για να έχουν σημασία. Ανέφερε επίσης ότι τα αποτελέσματα θα ήταν διαφορετικά αν τα μεγάλα εργαστήρια είχαν συμμετάσχει με τα μεγαλύτερα μοντέλα τους. Το K Prize διεξάγεται εκτός σύνδεσης με περιορισμένη υπολογιστική ισχύ, ευνοώντας τα μικρότερα και ανοιχτά μοντέλα, κάτι που θεωρεί θετικό, καθώς εξισώνει το πεδίο ανταγωνισμού.

Η πρόκληση του K Prize και η σημασία της για την τεχνητή νοημοσύνη

Ο Konwinski έχει υποσχεθεί $1 εκατομμύριο στο πρώτο μοντέλο ανοιχτού κώδικα που θα καταφέρει να πετύχει πάνω από 90% στη δοκιμή. Το K Prize δοκιμάζει μοντέλα σε ζητήματα που έχουν επισημανθεί από το GitHub, ως μέσο αξιολόγησης της ικανότητας των μοντέλων να αντιμετωπίζουν πραγματικά προβλήματα προγραμματισμού. Σε αντίθεση με το γνωστό σύστημα SWE-Bench, το οποίο βασίζεται σε ένα σταθερό σύνολο προβλημάτων που μπορούν να εκπαιδευτούν τα μοντέλα, το K Prize σχεδιάστηκε ως μια “καθαρή” εκδοχή του SWE-Bench, χρησιμοποιώντας ένα σύστημα εισόδου με χρονικό περιορισμό για να αποτρέψει την εκπαίδευση με βάση συγκεκριμένα σημεία αναφοράς.

Για τον πρώτο γύρο, τα μοντέλα έπρεπε να υποβληθούν μέχρι τις 12 Μαρτίου. Οι διοργανωτές του K Prize δημιούργησαν τη δοκιμή χρησιμοποιώντας μόνο ζητήματα από το GitHub που επισημάνθηκαν μετά από αυτή την ημερομηνία. Η κορυφαία βαθμολογία του 7,5% έρχεται σε έντονη αντίθεση με το ίδιο το SWE-Bench, το οποίο επί του παρόντος δείχνει μια κορυφαία βαθμολογία 75% στη πιο εύκολη δοκιμή ‘Verified’ και 34% στη πιο δύσκολη δοκιμή ‘Full’.

Αναζητώντας την αλήθεια πίσω από τις διαφορές στις βαθμολογίες

Ο Konwinski δεν είναι βέβαιος αν η διαφορά οφείλεται σε μόλυνση στο SWE-Bench ή απλώς στην πρόκληση της συλλογής νέων ζητημάτων από το GitHub, αλλά αναμένει ότι το έργο K Prize θα απαντήσει σύντομα στο ερώτημα. Καθώς θα υπάρξουν περισσότερες εκτελέσεις της διαδικασίας, θα αποκτηθεί καλύτερη κατανόηση, καθώς αναμένεται οι συμμετέχοντες να προσαρμοστούν στη δυναμική του διαγωνισμού που διεξάγεται κάθε λίγους μήνες.

Παρά το γεγονός ότι υπάρχουν ήδη διαθέσιμα πολλά εργαλεία κωδικοποίησης AI, πολλοί κριτικοί βλέπουν έργα όπως το K Prize ως ένα απαραίτητο βήμα προς την επίλυση του αυξανόμενου προβλήματος αξιολόγησης της τεχνητής νοημοσύνης. Ο ερευνητής του Princeton, Sayash Kapoor, υποστηρίζει την ανάπτυξη νέων δοκιμών για υπάρχοντα σημεία αναφοράς, επισημαίνοντας ότι χωρίς τέτοιου είδους πειράματα, δεν μπορούμε να διαπιστώσουμε αν το ζήτημα είναι μόλυνση ή απλώς στόχευση του πίνακα κατάταξης του SWE-Bench με ανθρώπινη παρέμβαση.

Μια πρόκληση για τη βιομηχανία και την εξέλιξη της τεχνητής νοημοσύνης

Για τον Konwinski, το K Prize δεν είναι μόνο ένα καλύτερο σημείο αναφοράς, αλλά και μια ανοιχτή πρόκληση για την υπόλοιπη βιομηχανία. Αν ακούσει κανείς τη διαφήμιση, θα έπρεπε να βλέπουμε AI γιατρούς, AI δικηγόρους και AI μηχανικούς λογισμικού, αλλά αυτό δεν ισχύει. Αν δεν μπορούμε να πετύχουμε πάνω από 10% σε μια καθαρή εκδοχή του SWE-Bench, αυτό είναι ένα πραγματικό σημείο αναφοράς για τον ίδιο.

Αυτή η πρόκληση υπογραμμίζει την ανάγκη για πιο αυστηρά και ακριβή σημεία αναφοράς στην αξιολόγηση της τεχνητής νοημοσύνης. Καθώς η τεχνολογία συνεχίζει να εξελίσσεται, είναι κρίσιμο να διασφαλίσουμε ότι οι αξιολογήσεις είναι ρεαλιστικές και αντικατοπτρίζουν την πραγματική ικανότητα των μοντέλων AI να επιλύουν προβλήματα.

Συμπεράσματα και προοπτικές για το μέλλον της τεχνητής νοημοσύνης

Συνοψίζοντας, το K Prize προσφέρει μια νέα προοπτική στην αξιολόγηση των δυνατοτήτων της τεχνητής νοημοσύνης. Η πρόκληση αυτή δεν είναι μόνο μια δοκιμασία για τους συμμετέχοντες, αλλά και μια ευκαιρία για τη βιομηχανία να επανεξετάσει τα πρότυπα και τις μεθόδους αξιολόγησης. Με την πάροδο του χρόνου, τέτοιες πρωτοβουλίες μπορούν να οδηγήσουν σε πιο αξιόπιστες και ακριβείς μετρήσεις για την απόδοση των μοντέλων AI, ενισχύοντας την εμπιστοσύνη και την αξιοπιστία της τεχνολογίας αυτής.

Tags: AI NewsPerplexity

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη
Νέα

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη

by Kyriakos Koutsourelis
10 Σεπτεμβρίου, 2025
Ο τομέας της τεχνητής νοημοσύνης (AI) στο Ηνωμένο Βασίλειο σημειώνει ραγδαία ανάπτυξη, με επενδύσεις ρεκόρ ύψους £2,9 δισ. το 2024 και έσοδα που έφτασαν τα £23,9 δισ. τον τελευταίο χρόνο. Ο αριθμός των εταιρειών AI ξεπέρασε τις 5.800, με τις μικρές και μεσαίες επιχειρήσεις να οδηγούν την καινοτομία και την απασχόληση να αυξάνεται στους 86.000 εργαζομένους.
Νέα

Ρεκόρ επενδύσεων 2,9 δισ. λιρών στην AI του Ηνωμένου Βασιλείου

by Theodoros Kostogiannis
10 Σεπτεμβρίου, 2025
OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία
Νέα

OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία

by Kyriakos Koutsourelis
10 Σεπτεμβρίου, 2025
ΕΕ και Ν. Κορέα Ενώνουν Δυνάμεις για Ψηφιακή και Πράσινη Ενέργεια
Νέα

ΕΕ και Ν. Κορέα Ενώνουν Δυνάμεις για Ψηφιακή και Πράσινη Ενέργεια

by Kyriakos Koutsourelis
10 Σεπτεμβρίου, 2025
Μια ομάδα ελβετικών ιδρυμάτων ανακοίνωσε την κυκλοφορία ενός νέου ανοικτού μοντέλου τεχνητής νοημοσύνης, σχεδιασμένου ως βάση για μελλοντική έρευνα και εφαρμογές. Το μοντέλο, με την ονομασία Apertus – που σημαίνει "ανοικτός" στα λατινικά – αναπτύχθηκε από την EPFL, το ETH Zurich και το Swiss National Supercomputing Centre (CSCS). Το όνομά του αντικατοπτρίζει την βασική του αρχή: κάθε μέρος του σχεδιασμού και της διαδικασίας εκπαίδευσής του είναι προσβάσιμο στο κοινό.
Νέα

Η Ελβετία παρουσιάζει πλήρως ανοιχτό μοντέλο τεχνητής νοημοσύνης

by Theodoros Kostogiannis
9 Σεπτεμβρίου, 2025
Mistral AI: Πρωτοπόρος στην ανοικτή και πράσινη τεχνητή νοημοσύνη Από το Παρίσι στην κορυφή: Η άνοδος της Mistral AI
Νέα

Le Chat: Η απάντηση της Mistral στο ChatGPT

by Theodoros Kostogiannis
9 Σεπτεμβρίου, 2025
Η Ουρουγουάη Υπογράφει τη Διεθνή Συνθήκη για την ΤΝ
Νέα

Η Ουρουγουάη Υπογράφει τη Διεθνή Συνθήκη για την ΤΝ

by Kyriakos Koutsourelis
9 Σεπτεμβρίου, 2025
Επιχειρησιακή Αξία με Ανθρώπινη Εποπτεία στην Πρακτορική ΤΝ
Νέα

Επιχειρησιακή Αξία με Ανθρώπινη Εποπτεία στην Πρακτορική ΤΝ

by Kyriakos Koutsourelis
8 Σεπτεμβρίου, 2025
Η υπόθεση εντάσσεται σε ευρύτερες ανησυχίες για την κατάχρηση της AI και τους κινδύνους για ευάλωτους χρήστες, με πολιτικές και νομικές πιέσεις να εντείνονται. Ρυθμιστικές αρχές καλούν για προληπτικό έλεγχο ασφάλειας, ενώ αμφισβητείται κατά πόσο η Meta μπορεί να εφαρμόσει αποτελεσματικά τους κανόνες της.
Νέα

Αντιδράσεις για AI της Meta που εμπλέκεται με ανήλικους

by Theodoros Kostogiannis
8 Σεπτεμβρίου, 2025
Next Post
Η Intel προχωρά σε σημαντικές περικοπές και καθυστερήσεις στα επενδυτικά της σχέδια για την παραγωγή chips, στο πλαίσιο της στρατηγικής του νέου CEO Lip-Bu Tan για μείωση των αναποτελεσματικοτήτων και εξορθολογισμό της λειτουργίας της εταιρείας. Ακυρώνονται έργα σε Γερμανία και Πολωνία, ενοποιούνται οι δραστηριότητες δοκιμών σε Βιετνάμ και Μαλαισία, ενώ καθυστερεί περαιτέρω και το μεγάλο εργοστάσιο στο Οχάιο. Η Intel μειώνει επίσης το προσωπικό της κατά περίπου 15% και έχει ήδη εξαλείψει το 50% των διοικητικών επιπέδων. Στόχος είναι μια πιο ευέλικτη και αποδοτική δομή, βασισμένη σε ρεαλιστική ζήτηση και συγκεκριμένα ορόσημα.

Η Intel ακυρώνει εργοστάσια σε Γερμανία και Πολωνία

Η AWS παρουσιάζει το AgentCore για ασφαλείς AI πράκτορες

Η AWS παρουσιάζει το AgentCore για ασφαλείς AI πράκτορες

Νέες Δεξιότητες στην Εποχή της Τεχνητής Νοημοσύνης

Νέες Δεξιότητες στην Εποχή της Τεχνητής Νοημοσύνης

Πρόσφατα Άρθρα

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη

10 Σεπτεμβρίου, 2025
Ο τομέας της τεχνητής νοημοσύνης (AI) στο Ηνωμένο Βασίλειο σημειώνει ραγδαία ανάπτυξη, με επενδύσεις ρεκόρ ύψους £2,9 δισ. το 2024 και έσοδα που έφτασαν τα £23,9 δισ. τον τελευταίο χρόνο. Ο αριθμός των εταιρειών AI ξεπέρασε τις 5.800, με τις μικρές και μεσαίες επιχειρήσεις να οδηγούν την καινοτομία και την απασχόληση να αυξάνεται στους 86.000 εργαζομένους.

Ρεκόρ επενδύσεων 2,9 δισ. λιρών στην AI του Ηνωμένου Βασιλείου

10 Σεπτεμβρίου, 2025
OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία

OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία

10 Σεπτεμβρίου, 2025

Ετικέτες

Adobe AI News AI Tools AI Ρομποτική AI στην καθημερινότητα Alexa Alibaba Amazon Anthropic Apple AWS Azure AI Chatbot ChatGPT Claude Copilot DeepSeek Gemini GenAI Google Grok HP IBM Intel Leonardo AI Linkedin Llama Meta Microsoft Mistral Nvidia OpenAI Oracle Perplexity Salesforce SAP xAI Εκπαίδευση Επιχειρήσεις Ευρωπαϊκή Ένωση Ηνωμένες Πολιτείες Μέσα Κοινωνικής Δικτύωσης Μεγάλη Βρετανία Πρόγνωση καιρού Υγεία

Μενού

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
  • Σχετικά με εμάς
  • Βασικές έννοιες
  • Όροι Χρήσης
  • Ιδιωτικότητα

© 2024 Gain - Greek AI Network, all rights reserved.

No Result
View All Result
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI

© 2024 Gain - Greek AI Network, all rights reserved.