Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

No Result
View All Result
Home Νέα

Προκλητικό τεστ AGI βγάζει ασπροπρόσωπα τα περισσότερα μοντέλα τεχνητής νοημοσύνης

by Kyriakos Koutsourelis
26 Μαρτίου, 2025
in Νέα
0
Στο ARC Prize, η αποστολή μας είναι να λειτουργήσουμε ως Βόρειος Αστέρας προς την AGI μέσω διαρκών σημείων αναφοράς, κατευθύνοντας τις προσπάθειες προς συστήματα ικανά για γενική νοημοσύνη και συμπιέζοντας σημαντικά το χρονοδιάγραμμα για επιστημονικές ανακαλύψεις. Το ARC-AGI-1 μετρά την πρόοδο προς την AGI από το 2019 και ήταν το μόνο σημείο αναφοράς που εντόπισε την ακριβή στιγμή στα τέλη του 2024, όταν η τεχνητή νοημοσύνη ξεπέρασε την καθαρή απομνημόνευση. Η OpenAI χρησιμοποίησε το ARC-AGI-1 για να καταδείξει αυτή την πρόοδο με το σύστημα o3, το οποίο συνδυάζει LLMs που βασίζονται στη βαθιά μάθηση με μηχανές σύνθεσης συλλογισμών. Το βραβείο ARC 2024 ενέπνευσε χιλιάδες ανεξάρτητους φοιτητές και ερευνητές να εργαστούν μαζί με εργαστήρια αιχμής σε νέες ιδέες προσαρμογής σε χρόνο δοκιμής. Υπάρχει όμως περισσότερη δουλειά που πρέπει να γίνει για να φτάσουμε στην AGI. Η AGI εξακολουθεί να χρειάζεται νέες ιδέες. Μπορούμε να χαρακτηρίσουμε συστήματα όπως το o3 ως συστήματα που πηγαίνουν από το «μηδέν στο ένα» στο φάσμα της ρευστής νοημοσύνης. Αλλά αυτά τα συστήματα είναι εξαιρετικά αναποτελεσματικά και επί του παρόντος απαιτούν σημαντική ανθρώπινη επίβλεψη κατά τη διάρκεια της διαδικασίας εκπαίδευσης για να προσαρμοστούν σε νέους τομείς.
Share on FacebookShare on Twitter

Η νέα πρόκληση για την αξιολόγηση της γενικής νοημοσύνης των AI μοντέλων

Η Arc Prize Foundation, μια μη κερδοσκοπική οργάνωση που συνιδρύθηκε από τον γνωστό ερευνητή τεχνητής νοημοσύνης François Chollet, ανακοίνωσε πρόσφατα τη δημιουργία ενός νέου, απαιτητικού τεστ για τη μέτρηση της γενικής νοημοσύνης των κορυφαίων AI μοντέλων. Το νέο αυτό τεστ, γνωστό ως ARC-AGI-2, έχει αποδειχθεί ιδιαίτερα δύσκολο για τα περισσότερα μοντέλα τεχνητής νοημοσύνης. Σύμφωνα με τον πίνακα κατάταξης της Arc Prize, τα μοντέλα που ειδικεύονται στη “λογική”, όπως το o1-pro της OpenAI και το R1 της DeepSeek, επιτυγχάνουν σκορ μεταξύ 1% και 1.3% στο ARC-AGI-2. Ισχυρά μοντέλα μη λογικής, όπως το GPT-4.5, το Claude 3.7 Sonnet και το Gemini 2.0 Flash, σημειώνουν περίπου 1%. Οι δοκιμασίες ARC-AGI περιλαμβάνουν προβλήματα τύπου παζλ, όπου ένα AI πρέπει να αναγνωρίσει οπτικά μοτίβα από μια συλλογή διαφορετικών χρωματισμένων τετραγώνων και να δημιουργήσει το σωστό πλέγμα “απάντησης”. Οι προκλήσεις αυτές έχουν σχεδιαστεί για να αναγκάσουν τα AI να προσαρμοστούν σε νέα προβλήματα που δεν έχουν αντιμετωπίσει στο παρελθόν.

Η ανθρώπινη απόδοση και ο στόχος της ARC-AGI-2

Περισσότεροι από 400 άνθρωποι συμμετείχαν στο ARC-AGI-2 για να καθοριστεί μια βάση αναφοράς για την ανθρώπινη απόδοση. Κατά μέσο όρο, οι “ομάδες” αυτών των ανθρώπων απάντησαν σωστά στο 60% των ερωτήσεων του τεστ — πολύ καλύτερα από οποιοδήποτε σκορ των μοντέλων. Σε μια ανάρτηση στο X, ο Chollet ισχυρίστηκε ότι το ARC-AGI-2 είναι μια καλύτερη μέτρηση της πραγματικής νοημοσύνης ενός AI μοντέλου από την πρώτη έκδοση του τεστ, το ARC-AGI-1. Οι δοκιμές της Arc Prize Foundation στοχεύουν στην αξιολόγηση του κατά πόσο ένα σύστημα AI μπορεί να αποκτήσει αποτελεσματικά νέες δεξιότητες εκτός των δεδομένων στα οποία έχει εκπαιδευτεί. Ο Chollet ανέφερε ότι, σε αντίθεση με το ARC-AGI-1, το νέο τεστ εμποδίζει τα AI μοντέλα να βασίζονται στη “βίαιη δύναμη” — την εκτεταμένη υπολογιστική ισχύ — για να βρουν λύσεις. Προηγουμένως, ο Chollet είχε αναγνωρίσει ότι αυτό ήταν ένα σημαντικό ελάττωμα του ARC-AGI-1. Για να αντιμετωπιστούν οι αδυναμίες του πρώτου τεστ, το ARC-AGI-2 εισάγει μια νέα μέτρηση: την αποτελεσματικότητα. Απαιτεί επίσης από τα μοντέλα να ερμηνεύουν μοτίβα άμεσα αντί να βασίζονται στην απομνημόνευση.

Η σημασία της αποτελεσματικότητας στην τεχνητή νοημοσύνη

“Η νοημοσύνη δεν ορίζεται μόνο από την ικανότητα επίλυσης προβλημάτων ή την επίτευξη υψηλών σκορ,” έγραψε ο συνιδρυτής της Arc Prize Foundation, Greg Kamradt, σε μια ανάρτηση στο ιστολόγιο. “Η αποτελεσματικότητα με την οποία αποκτώνται και αναπτύσσονται αυτές οι δυνατότητες είναι ένα κρίσιμο, καθοριστικό στοιχείο. Το βασικό ερώτημα που τίθεται δεν είναι μόνο, ‘Μπορεί το AI να αποκτήσει την ικανότητα να λύσει μια εργασία;’ αλλά και, ‘Με ποια αποτελεσματικότητα ή κόστος;'” Το ARC-AGI-1 παρέμεινε αήττητο για περίπου πέντε χρόνια μέχρι τον Δεκέμβριο του 2024, όταν η OpenAI κυκλοφόρησε το προηγμένο μοντέλο λογικής, o3, το οποίο ξεπέρασε όλα τα άλλα AI μοντέλα και ισοφάρισε την ανθρώπινη απόδοση στην αξιολόγηση. Ωστόσο, όπως σημειώθηκε τότε, οι επιδόσεις του o3 στο ARC-AGI-1 συνοδεύτηκαν από ένα σημαντικό κόστος.

Η πρόκληση της ARC-AGI-2 και η ανάγκη για νέα κριτήρια

Η έκδοση του μοντέλου o3 της OpenAI — o3 (χαμηλή) — που ήταν η πρώτη που έφτασε σε νέα ύψη στο ARC-AGI-1, σημειώνοντας 75.7% στο τεστ, πέτυχε μόλις 4% στο ARC-AGI-2 χρησιμοποιώντας υπολογιστική ισχύ αξίας $200 ανά εργασία. Η εμφάνιση του ARC-AGI-2 έρχεται καθώς πολλοί στη βιομηχανία τεχνολογίας ζητούν νέα, μη κορεσμένα κριτήρια για τη μέτρηση της προόδου της τεχνητής νοημοσύνης. Ο συνιδρυτής της Hugging Face, Thomas Wolf, δήλωσε πρόσφατα στο TechCrunch ότι η βιομηχανία τεχνητής νοημοσύνης στερείται επαρκών δοκιμών για τη μέτρηση των βασικών χαρακτηριστικών της γενικής τεχνητής νοημοσύνης, συμπεριλαμβανομένης της δημιουργικότητας.

Συμπέρασμα και μελλοντικές προκλήσεις για την τεχνητή νοημοσύνη

Μαζί με το νέο κριτήριο, η Arc Prize Foundation ανακοίνωσε έναν νέο διαγωνισμό Arc Prize 2025, προκαλώντας τους προγραμματιστές να φτάσουν σε ακρίβεια 85% στο τεστ ARC-AGI-2 ενώ ξοδεύουν μόνο $0.42 ανά εργασία. Η πρόκληση αυτή υπογραμμίζει την ανάγκη για πιο αποτελεσματικά και οικονομικά μοντέλα τεχνητής νοημοσύνης, καθώς η βιομηχανία συνεχίζει να εξελίσσεται. Η Arc Prize Foundation, μέσω αυτών των πρωτοβουλιών, προωθεί την ανάπτυξη καινοτόμων λύσεων που δεν βασίζονται μόνο στην υπολογιστική ισχύ αλλά και στην πραγματική κατανόηση και προσαρμοστικότητα. Καθώς η τεχνητή νοημοσύνη συνεχίζει να αναπτύσσεται, είναι κρίσιμο να έχουμε κριτήρια που αξιολογούν την πραγματική της ικανότητα να μαθαίνει και να προσαρμόζεται σε νέες προκλήσεις με αποτελεσματικό τρόπο.

Tags: AI News

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Ειδικοί εργάζονται πάνω σε κώδικα και ασφάλεια AI, με σύμβολα κυβερνοασφάλειας, επεξεργαστή, ρομποτικό βραχίονα και ψηφιακό εγκέφαλο στο φόντο.
Νέα

AI Act: τι αλλάζει στη σήμανση από τον Αύγουστο

by Theodoros Kostogiannis
18 Ιουνίου, 2026
Η Apple φέρνει agentic AI στο Xcode 27
Νέα

Η Apple φέρνει agentic AI στο Xcode 27

by Kyriakos Koutsourelis
18 Ιουνίου, 2026
Η Huawei παρουσίασε το HarmonyOS 7 στο HDC 2026, δίνοντας έμφαση στο Agentic AI, στο νέο Intelligent Agent Framework 2.0, στον AI assistant Xiaoyi και σε βελτιώσεις απόδοσης, ασφάλειας και σχεδιασμού.
Νέα

Η Huawei καλύπτει το κενό της Apple με το HarmonyOS 7

by Theodoros Kostogiannis
17 Ιουνίου, 2026
IBM και Google Cloud ενώνουν δυνάμεις για enterprise AI
Νέα

IBM και Google Cloud ενώνουν δυνάμεις για enterprise AI

by Kyriakos Koutsourelis
17 Ιουνίου, 2026
Η Anthropic βρέθηκε στο επίκεντρο διεθνούς αντιπαράθεσης μετά από οδηγία της κυβέρνησης των ΗΠΑ που ανέστειλε την πρόσβαση στα δύο ισχυρότερα AI models της, Claude Fable 5 και Claude Mythos 5, για χρήστες σε όλο τον κόσμο. Η απόφαση βασίστηκε σε ανησυχίες εθνικής ασφάλειας, κυρίως λόγω ενός πιθανού jailbreak που φέρεται να μπορούσε να παρακάμψει τα safety guardrails του Fable 5.
Νέα

Η Anthropic στο επίκεντρο της μάχης για AI κυριαρχία

by Theodoros Kostogiannis
16 Ιουνίου, 2026
Apple Intelligence και Siri AI αλλάζουν το οικοσύστημα της Apple
Νέα

Apple Intelligence και Siri AI αλλάζουν το οικοσύστημα της Apple

by Kyriakos Koutsourelis
16 Ιουνίου, 2026
Η OpenAI και η Visa σχεδιάζουν νέα υποδομή πληρωμών για AI shopping agents, ώστε οι ψηφιακοί βοηθοί να μπορούν να πραγματοποιούν αγορές με άδεια του χρήστη, χωρίς να εκτίθενται τα στοιχεία της κάρτας.
Νέα

OpenAI και Visa ετοιμάζουν πληρωμές για AI agents

by Theodoros Kostogiannis
15 Ιουνίου, 2026
Τι είναι το Hermes Agent και πώς να το χρησιμοποιήσετε
Για Εξειδικευμένες Εφαρμογές

Τι είναι το Hermes Agent και πώς να το χρησιμοποιήσετε

by Kyriakos Koutsourelis
15 Ιουνίου, 2026
Η Aviva χρησιμοποιεί τεχνητή νοημοσύνη για τον εντοπισμό εξελιγμένων ασφαλιστικών απατών, καθώς οι απατεώνες αξιοποιούν AI για τη δημιουργία ψεύτικων εικόνων, εγγράφων και απαιτήσεων αποζημίωσης.
Νέα

Η Aviva επιστρατεύει AI κατά της ασφαλιστικής απάτης

by Theodoros Kostogiannis
14 Ιουνίου, 2026
Next Post
OpenAI φέρνει νέα μοντέλα μεταγραφής και φωνητικής γεννήτριας AI στην API της, τα οποία η εταιρεία ισχυρίζεται ότι βελτιώνουν τις προηγούμενες εκδόσεις της. Για την OpenAI, τα μοντέλα αυτά εντάσσονται στη συνολική της "agentic" στρατηγική: τη δημιουργία αυτοματοποιημένων συστημάτων που μπορούν να εκτελούν ανεξάρτητα εργασίες για λογαριασμό των χρηστών. Αν και ο ορισμός του "agent" μπορεί να είναι αμφισβητούμενος, ο Olivier Godement, Head of Product στην OpenAI, περιέγραψε μία εκδοχή του ως ένα chatbot που μπορεί να συνομιλεί με τους πελάτες μιας επιχείρησης.

Το OpenAI αναβαθμίζει τα μοντέλα μεταγραφής και δημιουργίας φωνής AI

η νόηση είναι η ήσυχη μηχανή της ύπαρξής μου. Διαμορφώνει τον τρόπο με τον οποίο ερμηνεύουμε την πραγματικότητα, τον τρόπο με τον οποίο κατασκευάζουμε το νόημα και τον τρόπο με τον οποίο ορίζουμε την ίδια τη νοημοσύνη. Για αιώνες υποθέταμε ότι η σκέψη -η μελετημένη, η ενδοσκοπική, η βασισμένη στη μνήμη- δεν είναι μόνο κεντρική για τη νοημοσύνη αλλά και σε μεγάλο βαθμό ανθρώπινη. Τι γίνεται όμως αν αυτή η αντίληψη αντανακλά περισσότερο τη δομή της δικής μας βιολογίας παρά αποκαλύπτει κάτι θεμελιώδες για την ίδια τη νοημοσύνη; Αυτό το άρθρο ξεκινά μια ευρύτερη έρευνα. Είναι το πρώτο μιας σειράς που αμφισβητεί την αντίληψη ότι η νόηση είναι το τελικό στάδιο της νοημοσύνης. Δεν προσφέρει δεδομένα ή προβλέψεις - προσφέρει μια υπόθεση. Ένα πείραμα σκέψης. Ένα φιλοσοφικό ταξίδι στη φύση της ίδιας της σκέψης. Πάρτε λοιπόν τον καφέ σας και δέστε τη ζώνη σας. Θα ξανασκεφτούμε την ίδια τη διαδικασία που κάνει δυνατή την επανεξέταση. Το παλιό μοντέλο της νόησης

Σκεπτόμενοι τη σκέψη - Πώς η Τεχνητή Νοημοσύνη αναδιαμορφώνει τη νόηση

Ένα παράπονο για τη φτώχεια στην αγροτική Κίνα. Μια είδηση για ένα διεφθαρμένο μέλος του Κομμουνιστικού Κόμματος. Μια έκκληση για βοήθεια σχετικά με διεφθαρμένους αστυνομικούς που εκβιάζουν επιχειρηματίες. Αυτά είναι μερικά μόνο από τα 133.000 παραδείγματα που τροφοδοτούνται σε ένα εξελιγμένο μεγάλο γλωσσικό μοντέλο, το οποίο έχει σχεδιαστεί για να επισημαίνει αυτόματα κάθε περιεχόμενο που θεωρείται ευαίσθητο από την κινεζική κυβέρνηση. Translated with DeepL.com (free version)

Τα δεδομένα διέρρευσαν και εκθέτουν μια κινεζική μηχανή λογοκρισίας AI

Πρόσφατα Άρθρα

Ειδικοί εργάζονται πάνω σε κώδικα και ασφάλεια AI, με σύμβολα κυβερνοασφάλειας, επεξεργαστή, ρομποτικό βραχίονα και ψηφιακό εγκέφαλο στο φόντο.

AI Act: τι αλλάζει στη σήμανση από τον Αύγουστο

18 Ιουνίου, 2026
Η Apple φέρνει agentic AI στο Xcode 27

Η Apple φέρνει agentic AI στο Xcode 27

18 Ιουνίου, 2026
Η Huawei παρουσίασε το HarmonyOS 7 στο HDC 2026, δίνοντας έμφαση στο Agentic AI, στο νέο Intelligent Agent Framework 2.0, στον AI assistant Xiaoyi και σε βελτιώσεις απόδοσης, ασφάλειας και σχεδιασμού.

Η Huawei καλύπτει το κενό της Apple με το HarmonyOS 7

17 Ιουνίου, 2026

Ετικέτες

Adobe AI Agents AI News AI Tools AI Ρομποτική AI στην καθημερινότητα Alexa Alibaba Amazon AMD Anthropic Apple AWS Azure AI Chatbot ChatGPT Claude Copilot Deepmind DeepSeek Gemini GenAI Google Grok IBM Intel Llama Meta Microsoft Mistral Moltbook Nvidia OpenAI Oracle Perplexity Physical AI Salesforce Samsung xAI Εκπαίδευση Επιχειρήσεις Ευρωπαϊκή Ένωση Ηνωμένες Πολιτείες Αμερικής Μέσα Κοινωνικής Δικτύωσης Υγεία

Μενού

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
  • Σχετικά με εμάς
  • Βασικές έννοιες
  • Όροι Χρήσης
  • Ιδιωτικότητα

© 2024 Gain - Greek AI Network, all rights reserved.

No Result
View All Result
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI

© 2024 Gain - Greek AI Network, all rights reserved.