Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

No Result
View All Result
Home Νέα

Είπε ψέματα η xAI για τα benchmarks του Grok 3;

by Kyriakos Koutsourelis
24 Φεβρουαρίου, 2025
in Νέα
0
Οι συζητήσεις σχετικά με τους δείκτες αναφοράς τεχνητής νοημοσύνης - και τον τρόπο με τον οποίο αναφέρονται από τα εργαστήρια τεχνητής νοημοσύνης - ξεχειλίζουν στη δημοσιότητα. Αυτή την εβδομάδα, ένας υπάλληλος του OpenAI κατηγόρησε την εταιρεία AI του Elon Musk, xAI, ότι δημοσίευσε παραπλανητικά αποτελέσματα συγκριτικών μετρήσεων για το τελευταίο μοντέλο AI, το Grok 3. Ένας από τους συνιδρυτές της xAI, ο Igor Babushkin, επέμεινε ότι η εταιρεία είχε δίκιο. Translated with DeepL.com (free version)
Share on FacebookShare on Twitter

Οι Δημόσιες Συζητήσεις για τα Κριτήρια Αξιολόγησης της Τεχνητής Νοημοσύνης και η Διαμάχη με την xAI

Η συζήτηση γύρω από τα κριτήρια αξιολόγησης της τεχνητής νοημοσύνης και τον τρόπο με τον οποίο αυτά παρουσιάζονται από τα εργαστήρια AI έχει αρχίσει να γίνεται ευρέως γνωστή. Πρόσφατα, ένας υπάλληλος της OpenAI κατηγόρησε την εταιρεία τεχνητής νοημοσύνης του Elon Musk, xAI, για παραπλανητική παρουσίαση των αποτελεσμάτων αξιολόγησης του νέου της μοντέλου, Grok 3. Ο Igor Babushkin, συνιδρυτής της xAI, υπερασπίστηκε τη θέση της εταιρείας, υποστηρίζοντας ότι η προσέγγισή τους ήταν σωστή. Η αλήθεια πιθανώς βρίσκεται κάπου στο ενδιάμεσο.

Η Αμφιλεγόμενη Αξιολόγηση του Grok 3 και το AIME 2025

Σε μια ανάρτηση στο ιστολόγιο της xAI, η εταιρεία δημοσίευσε ένα γράφημα που δείχνει την απόδοση του Grok 3 στο AIME 2025, μια συλλογή από δύσκολα μαθηματικά προβλήματα από πρόσφατο διαγωνισμό. Κάποιοι ειδικοί έχουν εκφράσει αμφιβολίες για την εγκυρότητα του AIME ως κριτήριο αξιολόγησης για την τεχνητή νοημοσύνη. Παρ’ όλα αυτά, το AIME 2025 και παλαιότερες εκδοχές του τεστ χρησιμοποιούνται συχνά για να αξιολογηθεί η μαθηματική ικανότητα ενός μοντέλου.

Η Διαμάχη για τα Αποτελέσματα και το “cons@64”

Το γράφημα της xAI έδειξε ότι δύο παραλλαγές του Grok 3, το Grok 3 Reasoning Beta και το Grok 3 mini Reasoning, υπερείχαν του καλύτερου διαθέσιμου μοντέλου της OpenAI, o3-mini-high, στο AIME 2025. Ωστόσο, υπάλληλοι της OpenAI επισήμαναν ότι το γράφημα της xAI δεν περιλάμβανε τη βαθμολογία του o3-mini-high στο AIME 2025 με την προσθήκη “cons@64”.

Αναρωτιέστε τι είναι το “cons@64”; Πρόκειται για τη συντομογραφία του “consensus@64”, το οποίο ουσιαστικά δίνει σε ένα μοντέλο 64 προσπάθειες να απαντήσει σε κάθε πρόβλημα και λαμβάνει ως τελική απάντηση την πιο συχνά παραγόμενη. Όπως μπορείτε να φανταστείτε, το “cons@64” τείνει να αυξάνει σημαντικά τις βαθμολογίες των μοντέλων, και η παράλειψή του από ένα γράφημα μπορεί να δημιουργήσει την εντύπωση ότι ένα μοντέλο υπερέχει έναντι ενός άλλου, ενώ στην πραγματικότητα αυτό δεν ισχύει.

Η Πραγματική Απόδοση του Grok 3 και ο Ισχυρισμός της xAI

Οι βαθμολογίες του Grok 3 Reasoning Beta και του Grok 3 mini Reasoning στο AIME 2025 με την ένδειξη “@1” — που σημαίνει την πρώτη βαθμολογία που πέτυχαν τα μοντέλα στο κριτήριο — είναι χαμηλότερες από τη βαθμολογία του o3-mini-high. Το Grok 3 Reasoning Beta επίσης υπολείπεται ελαφρώς του μοντέλου o1 της OpenAI όταν αυτό είναι ρυθμισμένο σε “μέτρια” υπολογιστική ισχύ. Παρά ταύτα, η xAI διαφημίζει το Grok 3 ως την “εξυπνότερη τεχνητή νοημοσύνη στον κόσμο”.

Συμπεράσματα και Προκλήσεις για το Μέλλον της Αξιολόγησης AI

Η διαμάχη αυτή αναδεικνύει τις προκλήσεις που αντιμετωπίζει η κοινότητα της τεχνητής νοημοσύνης όσον αφορά την αντικειμενική αξιολόγηση και παρουσίαση των αποτελεσμάτων. Είναι σημαντικό οι εταιρείες να είναι διαφανείς και να παρέχουν πλήρη δεδομένα για τις επιδόσεις των μοντέλων τους, ώστε να αποφεύγονται παρανοήσεις και να διατηρείται η εμπιστοσύνη στο πεδίο. Καθώς η τεχνητή νοημοσύνη συνεχίζει να εξελίσσεται, η ανάγκη για αξιόπιστα και αμερόληπτα κριτήρια αξιολόγησης γίνεται όλο και πιο επιτακτική.

Αναμένουμε με ενδιαφέρον να δούμε πώς θα εξελιχθεί η συζήτηση αυτή και ποιες αλλαγές θα υιοθετηθούν για τη βελτίωση της αξιοπιστίας των κριτηρίων αξιολόγησης στο μέλλον.

Tags: AI NewsGrokxAI

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη
Νέα

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη

by Kyriakos Koutsourelis
10 Σεπτεμβρίου, 2025
Ο τομέας της τεχνητής νοημοσύνης (AI) στο Ηνωμένο Βασίλειο σημειώνει ραγδαία ανάπτυξη, με επενδύσεις ρεκόρ ύψους £2,9 δισ. το 2024 και έσοδα που έφτασαν τα £23,9 δισ. τον τελευταίο χρόνο. Ο αριθμός των εταιρειών AI ξεπέρασε τις 5.800, με τις μικρές και μεσαίες επιχειρήσεις να οδηγούν την καινοτομία και την απασχόληση να αυξάνεται στους 86.000 εργαζομένους.
Νέα

Ρεκόρ επενδύσεων 2,9 δισ. λιρών στην AI του Ηνωμένου Βασιλείου

by Theodoros Kostogiannis
10 Σεπτεμβρίου, 2025
OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία
Νέα

OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία

by Kyriakos Koutsourelis
10 Σεπτεμβρίου, 2025
ΕΕ και Ν. Κορέα Ενώνουν Δυνάμεις για Ψηφιακή και Πράσινη Ενέργεια
Νέα

ΕΕ και Ν. Κορέα Ενώνουν Δυνάμεις για Ψηφιακή και Πράσινη Ενέργεια

by Kyriakos Koutsourelis
10 Σεπτεμβρίου, 2025
Μια ομάδα ελβετικών ιδρυμάτων ανακοίνωσε την κυκλοφορία ενός νέου ανοικτού μοντέλου τεχνητής νοημοσύνης, σχεδιασμένου ως βάση για μελλοντική έρευνα και εφαρμογές. Το μοντέλο, με την ονομασία Apertus – που σημαίνει "ανοικτός" στα λατινικά – αναπτύχθηκε από την EPFL, το ETH Zurich και το Swiss National Supercomputing Centre (CSCS). Το όνομά του αντικατοπτρίζει την βασική του αρχή: κάθε μέρος του σχεδιασμού και της διαδικασίας εκπαίδευσής του είναι προσβάσιμο στο κοινό.
Νέα

Η Ελβετία παρουσιάζει πλήρως ανοιχτό μοντέλο τεχνητής νοημοσύνης

by Theodoros Kostogiannis
9 Σεπτεμβρίου, 2025
Mistral AI: Πρωτοπόρος στην ανοικτή και πράσινη τεχνητή νοημοσύνη Από το Παρίσι στην κορυφή: Η άνοδος της Mistral AI
Νέα

Le Chat: Η απάντηση της Mistral στο ChatGPT

by Theodoros Kostogiannis
9 Σεπτεμβρίου, 2025
Η Ουρουγουάη Υπογράφει τη Διεθνή Συνθήκη για την ΤΝ
Νέα

Η Ουρουγουάη Υπογράφει τη Διεθνή Συνθήκη για την ΤΝ

by Kyriakos Koutsourelis
9 Σεπτεμβρίου, 2025
Επιχειρησιακή Αξία με Ανθρώπινη Εποπτεία στην Πρακτορική ΤΝ
Νέα

Επιχειρησιακή Αξία με Ανθρώπινη Εποπτεία στην Πρακτορική ΤΝ

by Kyriakos Koutsourelis
8 Σεπτεμβρίου, 2025
Η υπόθεση εντάσσεται σε ευρύτερες ανησυχίες για την κατάχρηση της AI και τους κινδύνους για ευάλωτους χρήστες, με πολιτικές και νομικές πιέσεις να εντείνονται. Ρυθμιστικές αρχές καλούν για προληπτικό έλεγχο ασφάλειας, ενώ αμφισβητείται κατά πόσο η Meta μπορεί να εφαρμόσει αποτελεσματικά τους κανόνες της.
Νέα

Αντιδράσεις για AI της Meta που εμπλέκεται με ανήλικους

by Theodoros Kostogiannis
8 Σεπτεμβρίου, 2025
Next Post
Η Ιαπωνία βλέπει τη μετατόπιση του απορρήτου δεδομένων για να ενισχύσει την ανάπτυξη της τεχνητής νοημοσύνης Η κυβέρνηση εξετάζει το ενδεχόμενο να χαλαρώσει τους κανόνες συναίνεσης για τη χρήση ευαίσθητων προσωπικών πληροφοριών για να στηρίξει τη βιομηχανία τεχνητής νοημοσύνης. Η ιαπωνική κυβέρνηση εξετάζει σημαντικές αλλαγές στους κανονισμούς της για την προστασία των προσωπικών πληροφοριών, χαλαρώνοντας ενδεχομένως τους περιορισμούς σχετικά με τον τρόπο χειρισμού των ευαίσθητων προσωπικών δεδομένων. Η αλλαγή αυτή αποσκοπεί στην ενίσχυση της βιομηχανίας τεχνητής νοημοσύνης (AI) της χώρας.

Η Ιαπωνία βλέπει τη μετατόπιση του απορρήτου δεδομένων για να ενισχύσει την ανάπτυξη AI

Ο ρόλος της AI στον κυβερνοπόλεμο και την άμυνα του ΝΑΤΟ

Ο ρόλος της AI στον κυβερνοπόλεμο και την άμυνα του ΝΑΤΟ

Ώρα για ένα CERN στην Ευρωπαϊκή τεχνητή νοημοσύνη

Ώρα για ένα CERN στην Ευρωπαϊκή τεχνητή νοημοσύνη

Πρόσφατα Άρθρα

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη

Στόχος του Καζακστάν η Παγκόσμια Πρωτοπορία στην Τεχνητή Νοημοσύνη

10 Σεπτεμβρίου, 2025
Ο τομέας της τεχνητής νοημοσύνης (AI) στο Ηνωμένο Βασίλειο σημειώνει ραγδαία ανάπτυξη, με επενδύσεις ρεκόρ ύψους £2,9 δισ. το 2024 και έσοδα που έφτασαν τα £23,9 δισ. τον τελευταίο χρόνο. Ο αριθμός των εταιρειών AI ξεπέρασε τις 5.800, με τις μικρές και μεσαίες επιχειρήσεις να οδηγούν την καινοτομία και την απασχόληση να αυξάνεται στους 86.000 εργαζομένους.

Ρεκόρ επενδύσεων 2,9 δισ. λιρών στην AI του Ηνωμένου Βασιλείου

10 Σεπτεμβρίου, 2025
OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία

OpenAI: Η Ελλάδα στην Πρωτοπορία της Τεχνητής Νοημοσύνης στην Εκπαίδευση και την Καινοτομία

10 Σεπτεμβρίου, 2025

Ετικέτες

Adobe AI News AI Tools AI Ρομποτική AI στην καθημερινότητα Alexa Alibaba Amazon Anthropic Apple AWS Azure AI Chatbot ChatGPT Claude Copilot DeepSeek Gemini GenAI Google Grok HP IBM Intel Leonardo AI Linkedin Llama Meta Microsoft Mistral Nvidia OpenAI Oracle Perplexity Salesforce SAP xAI Εκπαίδευση Επιχειρήσεις Ευρωπαϊκή Ένωση Ηνωμένες Πολιτείες Μέσα Κοινωνικής Δικτύωσης Μεγάλη Βρετανία Πρόγνωση καιρού Υγεία

Μενού

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
  • Σχετικά με εμάς
  • Βασικές έννοιες
  • Όροι Χρήσης
  • Ιδιωτικότητα

© 2024 Gain - Greek AI Network, all rights reserved.

No Result
View All Result
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI

© 2024 Gain - Greek AI Network, all rights reserved.