Η Google Παρουσιάζει το Gemini 2.5: Νέα Γενιά Μοντέλων Τεχνητής Νοημοσύνης με Ικανότητες Λογικής Σκέψης
Η Google έκανε την επίσημη παρουσίαση του Gemini 2.5, μιας νέας οικογένειας μοντέλων τεχνητής νοημοσύνης που έχουν την ικανότητα να “σκέφτονται” πριν απαντήσουν σε ερωτήσεις. Το πρώτο μοντέλο αυτής της σειράς, το Gemini 2.5 Pro Experimental, είναι ένα πολυτροπικό μοντέλο λογικής που, σύμφωνα με την εταιρεία, είναι το πιο ευφυές μέχρι σήμερα. Το μοντέλο αυτό θα είναι διαθέσιμο από την Τρίτη στην πλατφόρμα προγραμματιστών της Google, το Google AI Studio, καθώς και στην εφαρμογή Gemini για τους συνδρομητές του προγράμματος Gemini Advanced, με μηνιαίο κόστος 20 δολάρια. Στο μέλλον, η Google σχεδιάζει να ενσωματώσει ικανότητες λογικής σε όλα τα νέα της μοντέλα τεχνητής νοημοσύνης.
Η Ανάπτυξη των Μοντέλων Λογικής και ο Ανταγωνισμός στην Τεχνολογία
Από τότε που η OpenAI παρουσίασε το πρώτο μοντέλο λογικής τεχνητής νοημοσύνης τον Σεπτέμβριο του 2024, η τεχνολογική βιομηχανία προσπαθεί να ανταγωνιστεί ή να υπερβεί τις δυνατότητες αυτού του μοντέλου με δικές της εκδοχές. Σήμερα, εταιρείες όπως οι Anthropic, DeepSeek, Google και xAI διαθέτουν μοντέλα τεχνητής νοημοσύνης με ικανότητες λογικής, τα οποία χρησιμοποιούν επιπλέον υπολογιστική ισχύ και χρόνο για να ελέγχουν τα γεγονότα και να αναλύουν προβλήματα πριν δώσουν απαντήσεις. Οι τεχνικές λογικής έχουν βοηθήσει τα μοντέλα τεχνητής νοημοσύνης να επιτύχουν νέες κορυφές σε μαθηματικές και κωδικοποιητικές εργασίες. Πολλοί στον τεχνολογικό κόσμο πιστεύουν ότι τα μοντέλα λογικής θα αποτελέσουν βασικό συστατικό των αυτόνομων συστημάτων τεχνητής νοημοσύνης, που μπορούν να εκτελούν εργασίες με ελάχιστη ανθρώπινη παρέμβαση. Ωστόσο, αυτά τα μοντέλα είναι επίσης πιο δαπανηρά.
Η Σημασία της Λογικής Σκέψης στα Μοντέλα Τεχνητής Νοημοσύνης
Η Google έχει ήδη πειραματιστεί με μοντέλα τεχνητής νοημοσύνης που διαθέτουν ικανότητες λογικής, έχοντας κυκλοφορήσει μια “σκεπτόμενη” έκδοση του Gemini τον Δεκέμβριο. Ωστόσο, το Gemini 2.5 αντιπροσωπεύει την πιο σοβαρή προσπάθεια της εταιρείας να ξεπεράσει τη σειρά μοντέλων o της OpenAI. Η Google ισχυρίζεται ότι το Gemini 2.5 Pro υπερβαίνει τις προηγούμενες εκδόσεις της και ορισμένα από τα κορυφαία ανταγωνιστικά μοντέλα σε διάφορα κριτήρια. Συγκεκριμένα, η Google σχεδίασε το Gemini 2.5 για να διαπρέπει στη δημιουργία οπτικά εντυπωσιακών εφαρμογών ιστού και εφαρμογών κωδικοποίησης. Στην αξιολόγηση Aider Polyglot για την επεξεργασία κώδικα, το Gemini 2.5 Pro σημειώνει 68.6%, υπερβαίνοντας τα κορυφαία μοντέλα τεχνητής νοημοσύνης από την OpenAI, την Anthropic και το κινεζικό εργαστήριο DeepSeek.
Δυνατότητες και Προοπτικές του Gemini 2.5 Pro
Στην αξιολόγηση SWE-bench Verified, που μετρά τις ικανότητες ανάπτυξης λογισμικού, το Gemini 2.5 Pro σημειώνει 63.8%, υπερβαίνοντας το o3-mini της OpenAI και το R1 της DeepSeek, αλλά υπολείπεται του Claude 3.7 Sonnet της Anthropic, που σημείωσε 70.3%. Στο Humanity’s Last Exam, μια πολυτροπική δοκιμή με χιλιάδες ερωτήσεις που σχετίζονται με τα μαθηματικά, τις ανθρωπιστικές επιστήμες και τις φυσικές επιστήμες, η Google αναφέρει ότι το Gemini 2.5 Pro σημειώνει 18.8%, αποδίδοντας καλύτερα από τα περισσότερα ανταγωνιστικά μοντέλα.
Συμπεράσματα και Μελλοντικές Προοπτικές
Το Gemini 2.5 Pro ξεκινά με ένα παράθυρο περιεχομένου 1 εκατομμυρίου tokens, που σημαίνει ότι το μοντέλο τεχνητής νοημοσύνης μπορεί να επεξεργαστεί περίπου 750.000 λέξεις σε μία μόνο προσπάθεια. Αυτό είναι μεγαλύτερο από ολόκληρη τη σειρά βιβλίων “Ο Άρχοντας των Δαχτυλιδιών”. Σύντομα, το Gemini 2.5 Pro θα υποστηρίζει διπλάσιο μήκος εισόδου (2 εκατομμύρια tokens). Η Google δεν δημοσίευσε ακόμη τιμές API για το Gemini 2.5 Pro, αλλά αναφέρει ότι θα μοιραστεί περισσότερες πληροφορίες τις επόμενες εβδομάδες. “Τα μοντέλα Gemini 2.5 είναι μοντέλα σκέψης, ικανά να αναλύουν τις σκέψεις τους πριν απαντήσουν, με αποτέλεσμα βελτιωμένη απόδοση και ακρίβεια,” ανέφερε η Google σε ανάρτηση στο ιστολόγιό της. Με το Gemini 2.5, η Google δήλωσε ότι έχει βελτιώσει την απόδοσή της συνδυάζοντας ένα σημαντικά ενισχυμένο βασικό μοντέλο με βελτιωμένη μετα-εκπαίδευση.