Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

No Result
View All Result
Home Νέα

Προκλητικό τεστ AGI βγάζει ασπροπρόσωπα τα περισσότερα μοντέλα τεχνητής νοημοσύνης

by Kyriakos Koutsourelis
26 Μαρτίου, 2025
in Νέα
0
Στο ARC Prize, η αποστολή μας είναι να λειτουργήσουμε ως Βόρειος Αστέρας προς την AGI μέσω διαρκών σημείων αναφοράς, κατευθύνοντας τις προσπάθειες προς συστήματα ικανά για γενική νοημοσύνη και συμπιέζοντας σημαντικά το χρονοδιάγραμμα για επιστημονικές ανακαλύψεις. Το ARC-AGI-1 μετρά την πρόοδο προς την AGI από το 2019 και ήταν το μόνο σημείο αναφοράς που εντόπισε την ακριβή στιγμή στα τέλη του 2024, όταν η τεχνητή νοημοσύνη ξεπέρασε την καθαρή απομνημόνευση. Η OpenAI χρησιμοποίησε το ARC-AGI-1 για να καταδείξει αυτή την πρόοδο με το σύστημα o3, το οποίο συνδυάζει LLMs που βασίζονται στη βαθιά μάθηση με μηχανές σύνθεσης συλλογισμών. Το βραβείο ARC 2024 ενέπνευσε χιλιάδες ανεξάρτητους φοιτητές και ερευνητές να εργαστούν μαζί με εργαστήρια αιχμής σε νέες ιδέες προσαρμογής σε χρόνο δοκιμής. Υπάρχει όμως περισσότερη δουλειά που πρέπει να γίνει για να φτάσουμε στην AGI. Η AGI εξακολουθεί να χρειάζεται νέες ιδέες. Μπορούμε να χαρακτηρίσουμε συστήματα όπως το o3 ως συστήματα που πηγαίνουν από το «μηδέν στο ένα» στο φάσμα της ρευστής νοημοσύνης. Αλλά αυτά τα συστήματα είναι εξαιρετικά αναποτελεσματικά και επί του παρόντος απαιτούν σημαντική ανθρώπινη επίβλεψη κατά τη διάρκεια της διαδικασίας εκπαίδευσης για να προσαρμοστούν σε νέους τομείς.
Share on FacebookShare on Twitter

Η νέα πρόκληση για την αξιολόγηση της γενικής νοημοσύνης των AI μοντέλων

Η Arc Prize Foundation, μια μη κερδοσκοπική οργάνωση που συνιδρύθηκε από τον γνωστό ερευνητή τεχνητής νοημοσύνης François Chollet, ανακοίνωσε πρόσφατα τη δημιουργία ενός νέου, απαιτητικού τεστ για τη μέτρηση της γενικής νοημοσύνης των κορυφαίων AI μοντέλων. Το νέο αυτό τεστ, γνωστό ως ARC-AGI-2, έχει αποδειχθεί ιδιαίτερα δύσκολο για τα περισσότερα μοντέλα τεχνητής νοημοσύνης. Σύμφωνα με τον πίνακα κατάταξης της Arc Prize, τα μοντέλα που ειδικεύονται στη “λογική”, όπως το o1-pro της OpenAI και το R1 της DeepSeek, επιτυγχάνουν σκορ μεταξύ 1% και 1.3% στο ARC-AGI-2. Ισχυρά μοντέλα μη λογικής, όπως το GPT-4.5, το Claude 3.7 Sonnet και το Gemini 2.0 Flash, σημειώνουν περίπου 1%. Οι δοκιμασίες ARC-AGI περιλαμβάνουν προβλήματα τύπου παζλ, όπου ένα AI πρέπει να αναγνωρίσει οπτικά μοτίβα από μια συλλογή διαφορετικών χρωματισμένων τετραγώνων και να δημιουργήσει το σωστό πλέγμα “απάντησης”. Οι προκλήσεις αυτές έχουν σχεδιαστεί για να αναγκάσουν τα AI να προσαρμοστούν σε νέα προβλήματα που δεν έχουν αντιμετωπίσει στο παρελθόν.

Η ανθρώπινη απόδοση και ο στόχος της ARC-AGI-2

Περισσότεροι από 400 άνθρωποι συμμετείχαν στο ARC-AGI-2 για να καθοριστεί μια βάση αναφοράς για την ανθρώπινη απόδοση. Κατά μέσο όρο, οι “ομάδες” αυτών των ανθρώπων απάντησαν σωστά στο 60% των ερωτήσεων του τεστ — πολύ καλύτερα από οποιοδήποτε σκορ των μοντέλων. Σε μια ανάρτηση στο X, ο Chollet ισχυρίστηκε ότι το ARC-AGI-2 είναι μια καλύτερη μέτρηση της πραγματικής νοημοσύνης ενός AI μοντέλου από την πρώτη έκδοση του τεστ, το ARC-AGI-1. Οι δοκιμές της Arc Prize Foundation στοχεύουν στην αξιολόγηση του κατά πόσο ένα σύστημα AI μπορεί να αποκτήσει αποτελεσματικά νέες δεξιότητες εκτός των δεδομένων στα οποία έχει εκπαιδευτεί. Ο Chollet ανέφερε ότι, σε αντίθεση με το ARC-AGI-1, το νέο τεστ εμποδίζει τα AI μοντέλα να βασίζονται στη “βίαιη δύναμη” — την εκτεταμένη υπολογιστική ισχύ — για να βρουν λύσεις. Προηγουμένως, ο Chollet είχε αναγνωρίσει ότι αυτό ήταν ένα σημαντικό ελάττωμα του ARC-AGI-1. Για να αντιμετωπιστούν οι αδυναμίες του πρώτου τεστ, το ARC-AGI-2 εισάγει μια νέα μέτρηση: την αποτελεσματικότητα. Απαιτεί επίσης από τα μοντέλα να ερμηνεύουν μοτίβα άμεσα αντί να βασίζονται στην απομνημόνευση.

Η σημασία της αποτελεσματικότητας στην τεχνητή νοημοσύνη

“Η νοημοσύνη δεν ορίζεται μόνο από την ικανότητα επίλυσης προβλημάτων ή την επίτευξη υψηλών σκορ,” έγραψε ο συνιδρυτής της Arc Prize Foundation, Greg Kamradt, σε μια ανάρτηση στο ιστολόγιο. “Η αποτελεσματικότητα με την οποία αποκτώνται και αναπτύσσονται αυτές οι δυνατότητες είναι ένα κρίσιμο, καθοριστικό στοιχείο. Το βασικό ερώτημα που τίθεται δεν είναι μόνο, ‘Μπορεί το AI να αποκτήσει την ικανότητα να λύσει μια εργασία;’ αλλά και, ‘Με ποια αποτελεσματικότητα ή κόστος;'” Το ARC-AGI-1 παρέμεινε αήττητο για περίπου πέντε χρόνια μέχρι τον Δεκέμβριο του 2024, όταν η OpenAI κυκλοφόρησε το προηγμένο μοντέλο λογικής, o3, το οποίο ξεπέρασε όλα τα άλλα AI μοντέλα και ισοφάρισε την ανθρώπινη απόδοση στην αξιολόγηση. Ωστόσο, όπως σημειώθηκε τότε, οι επιδόσεις του o3 στο ARC-AGI-1 συνοδεύτηκαν από ένα σημαντικό κόστος.

Η πρόκληση της ARC-AGI-2 και η ανάγκη για νέα κριτήρια

Η έκδοση του μοντέλου o3 της OpenAI — o3 (χαμηλή) — που ήταν η πρώτη που έφτασε σε νέα ύψη στο ARC-AGI-1, σημειώνοντας 75.7% στο τεστ, πέτυχε μόλις 4% στο ARC-AGI-2 χρησιμοποιώντας υπολογιστική ισχύ αξίας $200 ανά εργασία. Η εμφάνιση του ARC-AGI-2 έρχεται καθώς πολλοί στη βιομηχανία τεχνολογίας ζητούν νέα, μη κορεσμένα κριτήρια για τη μέτρηση της προόδου της τεχνητής νοημοσύνης. Ο συνιδρυτής της Hugging Face, Thomas Wolf, δήλωσε πρόσφατα στο TechCrunch ότι η βιομηχανία τεχνητής νοημοσύνης στερείται επαρκών δοκιμών για τη μέτρηση των βασικών χαρακτηριστικών της γενικής τεχνητής νοημοσύνης, συμπεριλαμβανομένης της δημιουργικότητας.

Συμπέρασμα και μελλοντικές προκλήσεις για την τεχνητή νοημοσύνη

Μαζί με το νέο κριτήριο, η Arc Prize Foundation ανακοίνωσε έναν νέο διαγωνισμό Arc Prize 2025, προκαλώντας τους προγραμματιστές να φτάσουν σε ακρίβεια 85% στο τεστ ARC-AGI-2 ενώ ξοδεύουν μόνο $0.42 ανά εργασία. Η πρόκληση αυτή υπογραμμίζει την ανάγκη για πιο αποτελεσματικά και οικονομικά μοντέλα τεχνητής νοημοσύνης, καθώς η βιομηχανία συνεχίζει να εξελίσσεται. Η Arc Prize Foundation, μέσω αυτών των πρωτοβουλιών, προωθεί την ανάπτυξη καινοτόμων λύσεων που δεν βασίζονται μόνο στην υπολογιστική ισχύ αλλά και στην πραγματική κατανόηση και προσαρμοστικότητα. Καθώς η τεχνητή νοημοσύνη συνεχίζει να αναπτύσσεται, είναι κρίσιμο να έχουμε κριτήρια που αξιολογούν την πραγματική της ικανότητα να μαθαίνει και να προσαρμόζεται σε νέες προκλήσεις με αποτελεσματικό τρόπο.

Tags: AI News

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Η συνεργασία NVIDIA και Google Cloud στοχεύει να προσφέρει μια ολοκληρωμένη AI υποδομή για επιχειρήσεις, developers και βιομηχανίες, καλύπτοντας από large-scale inference και cybersecurity μέχρι drug discovery, autonomous agents και βιομηχανικούς αυτοματισμούς.
Νέα

Google Cloud και NVIDIA μειώνουν το κόστος AI inference

by Theodoros Kostogiannis
1 Μαΐου, 2026
Η Anthropic ερευνά πιθανή παραβίαση του Mythos AI
Για Εξειδικευμένες Εφαρμογές

Η Anthropic ερευνά πιθανή παραβίαση του Mythos AI

by Kyriakos Koutsourelis
1 Μαΐου, 2026
Ρομπότ Sony AI νικά παίκτες στο πινγκ πονγκ. Ρομπότ της Sony AI κερδίζει παίκτες, ενώ ανθρωποειδές ρομπότ κερδίζει αγώνα στο Πεκίνο.
Νέα

Η Sony AI δοκιμάζει ρομπότ σε αγώνες πινγκ πονγκ

by Theodoros Kostogiannis
30 Απριλίου, 2026
Η Kakao Mobility επενδύει σε Level 4 αυτονομία και φυσική AI.
Νέα

Η Kakao Mobility ανοίγει οικοσύστημα για αυτόνομα οχήματα

by Theodoros Kostogiannis
30 Απριλίου, 2026
Meta παρακολουθεί εργαζόμενους για εκπαίδευση AI: Όρια, ηθική και το μέλλον της εργασίας
Νέα

Meta παρακολουθεί εργαζόμενους για εκπαίδευση AI: Όρια, ηθική και το μέλλον της εργασίας

by Kyriakos Koutsourelis
30 Απριλίου, 2026
Το Bob της IBM βάζει κανόνες στην AI ανάπτυξη κώδικα.
Νέα

IBM Bob: AI πλατφόρμα για ασφαλέστερη ανάπτυξη λογισμικού

by Theodoros Kostogiannis
29 Απριλίου, 2026
Η Lightelligence, η πρώτη εταιρεία photonics chips από την ηπειρωτική Κίνα που εισήχθη στο χρηματιστήριο του Χονγκ Κονγκ, είδε την τιμή της μετοχής της να εκτοξεύεται σχεδόν 400% στο χρηματιστηριακό της ντεμπούτο.
Νέα

Η Lightelligence ποντάρει στη φωτονική για την AI

by Theodoros Kostogiannis
29 Απριλίου, 2026
Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας
Για Εξειδικευμένες Εφαρμογές

Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας

by Kyriakos Koutsourelis
29 Απριλίου, 2026
Engineering the World: Το συνέδριο που φέρνει το AI από τη θεωρία στη βιομηχανία
Νέα

Engineering the World: Το συνέδριο που φέρνει το AI από τη θεωρία στη βιομηχανία

by Kyriakos Koutsourelis
28 Απριλίου, 2026
Next Post
OpenAI φέρνει νέα μοντέλα μεταγραφής και φωνητικής γεννήτριας AI στην API της, τα οποία η εταιρεία ισχυρίζεται ότι βελτιώνουν τις προηγούμενες εκδόσεις της. Για την OpenAI, τα μοντέλα αυτά εντάσσονται στη συνολική της "agentic" στρατηγική: τη δημιουργία αυτοματοποιημένων συστημάτων που μπορούν να εκτελούν ανεξάρτητα εργασίες για λογαριασμό των χρηστών. Αν και ο ορισμός του "agent" μπορεί να είναι αμφισβητούμενος, ο Olivier Godement, Head of Product στην OpenAI, περιέγραψε μία εκδοχή του ως ένα chatbot που μπορεί να συνομιλεί με τους πελάτες μιας επιχείρησης.

Το OpenAI αναβαθμίζει τα μοντέλα μεταγραφής και δημιουργίας φωνής AI

η νόηση είναι η ήσυχη μηχανή της ύπαρξής μου. Διαμορφώνει τον τρόπο με τον οποίο ερμηνεύουμε την πραγματικότητα, τον τρόπο με τον οποίο κατασκευάζουμε το νόημα και τον τρόπο με τον οποίο ορίζουμε την ίδια τη νοημοσύνη. Για αιώνες υποθέταμε ότι η σκέψη -η μελετημένη, η ενδοσκοπική, η βασισμένη στη μνήμη- δεν είναι μόνο κεντρική για τη νοημοσύνη αλλά και σε μεγάλο βαθμό ανθρώπινη. Τι γίνεται όμως αν αυτή η αντίληψη αντανακλά περισσότερο τη δομή της δικής μας βιολογίας παρά αποκαλύπτει κάτι θεμελιώδες για την ίδια τη νοημοσύνη; Αυτό το άρθρο ξεκινά μια ευρύτερη έρευνα. Είναι το πρώτο μιας σειράς που αμφισβητεί την αντίληψη ότι η νόηση είναι το τελικό στάδιο της νοημοσύνης. Δεν προσφέρει δεδομένα ή προβλέψεις - προσφέρει μια υπόθεση. Ένα πείραμα σκέψης. Ένα φιλοσοφικό ταξίδι στη φύση της ίδιας της σκέψης. Πάρτε λοιπόν τον καφέ σας και δέστε τη ζώνη σας. Θα ξανασκεφτούμε την ίδια τη διαδικασία που κάνει δυνατή την επανεξέταση. Το παλιό μοντέλο της νόησης

Σκεπτόμενοι τη σκέψη - Πώς η Τεχνητή Νοημοσύνη αναδιαμορφώνει τη νόηση

Ένα παράπονο για τη φτώχεια στην αγροτική Κίνα. Μια είδηση για ένα διεφθαρμένο μέλος του Κομμουνιστικού Κόμματος. Μια έκκληση για βοήθεια σχετικά με διεφθαρμένους αστυνομικούς που εκβιάζουν επιχειρηματίες. Αυτά είναι μερικά μόνο από τα 133.000 παραδείγματα που τροφοδοτούνται σε ένα εξελιγμένο μεγάλο γλωσσικό μοντέλο, το οποίο έχει σχεδιαστεί για να επισημαίνει αυτόματα κάθε περιεχόμενο που θεωρείται ευαίσθητο από την κινεζική κυβέρνηση. Translated with DeepL.com (free version)

Τα δεδομένα διέρρευσαν και εκθέτουν μια κινεζική μηχανή λογοκρισίας AI

Πρόσφατα Άρθρα

Η συνεργασία NVIDIA και Google Cloud στοχεύει να προσφέρει μια ολοκληρωμένη AI υποδομή για επιχειρήσεις, developers και βιομηχανίες, καλύπτοντας από large-scale inference και cybersecurity μέχρι drug discovery, autonomous agents και βιομηχανικούς αυτοματισμούς.

Google Cloud και NVIDIA μειώνουν το κόστος AI inference

1 Μαΐου, 2026
Η Anthropic ερευνά πιθανή παραβίαση του Mythos AI

Η Anthropic ερευνά πιθανή παραβίαση του Mythos AI

1 Μαΐου, 2026
Ρομπότ Sony AI νικά παίκτες στο πινγκ πονγκ. Ρομπότ της Sony AI κερδίζει παίκτες, ενώ ανθρωποειδές ρομπότ κερδίζει αγώνα στο Πεκίνο.

Η Sony AI δοκιμάζει ρομπότ σε αγώνες πινγκ πονγκ

30 Απριλίου, 2026

Ετικέτες

Adobe AI Agents AI News AI Tools AI Ρομποτική AI στην καθημερινότητα Alexa Alibaba Amazon Anthropic Apple AWS Azure AI Chatbot ChatGPT Claude Copilot Deepmind DeepSeek Gemini GenAI Google Grok IBM Intel Llama Meta Microsoft Mistral Moltbook Nvidia OpenAI Oracle Perplexity Physical AI Salesforce Samsung SAP xAI Εκπαίδευση Επιχειρήσεις Ευρωπαϊκή Ένωση Ηνωμένες Πολιτείες Αμερικής Μέσα Κοινωνικής Δικτύωσης Υγεία

Μενού

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
  • Σχετικά με εμάς
  • Βασικές έννοιες
  • Όροι Χρήσης
  • Ιδιωτικότητα

© 2024 Gain - Greek AI Network, all rights reserved.

No Result
View All Result
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI

© 2024 Gain - Greek AI Network, all rights reserved.