Οι μεγάλες γλωσσικές μονάδες (LLMs) όπως το o1 της OpenAI έχουν αναζωπυρώσει τη συζήτηση για την επίτευξη της Τεχνητής Γενικής Νοημοσύνης (AGI). Ωστόσο, πολλοί ειδικοί θεωρούν ότι τα LLMs από μόνα τους δεν αρκούν για να επιτύχουν αυτόν τον στόχο.
Τι είναι η AGI και γιατί έχει σημασία;
Η AGI (Artificial General Intelligence) αναφέρεται σε μια μορφή τεχνητής νοημοσύνης που μπορεί να εκτελεί κάθε γνωστική εργασία που μπορεί να εκτελέσει ένας άνθρωπος, όπως η γενίκευση γνώσης, ο αφηρημένος συλλογισμός, ο σχεδιασμός και η επιλογή των κατάλληλων πηγών πληροφορίας. Μια τέτοια τεχνολογία θα μπορούσε να λύσει κρίσιμα προβλήματα, όπως η κλιματική αλλαγή, οι πανδημίες και η ανακάλυψη φαρμάκων για ασθένειες όπως ο καρκίνος και το Αλτσχάιμερ. Ωστόσο, αυτή η τεράστια δύναμη θα μπορούσε επίσης να φέρει κινδύνους για την ανθρωπότητα, είτε λόγω κακής χρήσης είτε λόγω απώλειας ελέγχου.
Ο Γιοσούα Μπενγκιό (Yoshua Bengio), ειδικός στη βαθιά μάθηση από το Πανεπιστήμιο του Μόντρεαλ, τονίζει ότι «κακά πράγματα θα μπορούσαν να συμβούν είτε λόγω κακής χρήσης της AI είτε λόγω της απώλειας ελέγχου της».
Πώς προέκυψε η συζήτηση για την AGI;
Η έννοια της AGI εισήχθη ευρύτερα το 2007, με το βιβλίο των ερευνητών Μπεν Γκέρτζελ (Ben Goertzel) και Κάσιο Πενάτσιν (Cassio Pennachin). Παρόλο που ο ακριβής ορισμός της AGI παραμένει ασαφής, αναφέρεται γενικά σε μια AI που έχει ανθρώπινη ικανότητα στη λογική και τη γενίκευση.
Για μεγάλο χρονικό διάστημα, θεωρήθηκε προφανές ότι η AGI δεν είχε ακόμη επιτευχθεί. Για παράδειγμα, το πρόγραμμα AlphaGo της Google DeepMind μπορεί να νικάει τους καλύτερους ανθρώπινους παίκτες στο επιτραπέζιο παιχνίδι Go, αλλά οι ικανότητές του περιορίζονται αποκλειστικά σε αυτό το παιχνίδι.
Ποιος είναι ο ρόλος των LLMs στη συζήτηση για την AGI;
Τα LLMs, όπως το o1 της OpenAI, έχουν προκαλέσει αναθεώρηση των απόψεων σχετικά με την AGI. Τα LLMs μπορούν να κατανοούν και να παράγουν κείμενο με τρόπους που μοιάζουν με την ανθρώπινη γλώσσα. Η χρήση της αρχιτεκτονικής “transformer” έχει βελτιώσει δραματικά τις δυνατότητες κατανόησης της γλώσσας από τα LLMs, καθώς επιτρέπει στα μοντέλα να κατανοούν τη σχέση μεταξύ λέξεων που βρίσκονται σε μεγάλη απόσταση μεταξύ τους μέσα στο κείμενο.
Η προσέγγιση αυτή τους επιτρέπει να διακρίνουν διαφορετικές έννοιες της ίδιας λέξης, όπως η λέξη “bank” που μπορεί να σημαίνει “τράπεζα” ή “όχθη ποταμού”, ανάλογα με το πλαίσιο. Οι δυνατότητες αυτές έχουν οδηγήσει ορισμένους να πιστεύουν ότι η AGI μπορεί να εμφανιστεί αυθόρμητα, αν τα LLMs γίνουν αρκετά μεγάλα.
Ποιοι είναι οι περιορισμοί των LLMs;
Παρά τις προόδους τους, τα LLMs έχουν σαφή όρια. Ένα σημαντικό παράδειγμα είναι η αδυναμία τους να διαχειριστούν εργασίες που απαιτούν πολυβήματη λογική ή αφηρημένη σκέψη. Παρόλο που το o1 της OpenAI μπορεί να εκτελεί σχέδια με έως και 16 βήματα, η απόδοσή του πέφτει ραγδαία όταν τα βήματα αυξάνονται σε 20 ή περισσότερα.
Ο Φρανσουά Σολέ (Francois Chollet) διεξήγαγε πειράματα που έδειξαν ότι, αν και τα LLMs φαίνεται να δημιουργούν εσωτερικά “μοντέλα του κόσμου”, αυτά τα μοντέλα είναι συχνά ασαφή ή λανθασμένα. Για παράδειγμα, ένα μοντέλο που εκπαιδεύτηκε σε δεδομένα διαδρομών ταξί στη Νέα Υόρκη δημιούργησε έναν εσωτερικό χάρτη της πόλης, αλλά αυτός ο χάρτης περιείχε ανύπαρκτους δρόμους και αδύνατες διαδρομές.
Γιατί τα LLMs δεν επαρκούν από μόνα τους για AGI;
Ένας από τους κύριους λόγους είναι ότι τα LLMs έχουν περιορισμένη ικανότητα “προσαρμογής στη νεωτερικότητα” (adaptation to novelty). Δηλαδή, δεν μπορούν να συνδυάσουν την ήδη αποκτηθείσα γνώση τους για να λύσουν νέες και άγνωστες εργασίες. Αυτό απαιτεί έναν πιο γενικό μηχανισμό μάθησης, όπως αυτόν που διαθέτουν οι άνθρωποι.
Επιπλέον, τα LLMs δεν διαθέτουν ισχυρούς μηχανισμούς εσωτερικής ανάδρασης (feedback). Στους ανθρώπους, η ανάδραση επιτρέπει στον εγκέφαλο να στέλνει πληροφορίες “προς τα πίσω”, επηρεάζοντας την κατανόηση των αισθητηριακών ερεθισμάτων. Ορισμένοι ερευνητές, όπως ο Ντιλίπ Τζορτζ (Dileep George) της Google DeepMind, πιστεύουν ότι η ενσωμάτωση ανάδρασης στα AI συστήματα είναι απαραίτητη για την επίτευξη της AGI.
Ποια είναι τα επόμενα βήματα για την επίτευξη της AGI;
Για να προσεγγίσουμε την AGI, οι ερευνητές εργάζονται πάνω σε νέες αρχιτεκτονικές μοντέλων. Ο Γιοσούα Μπενγκιό προτείνει τη χρήση “γεννητικών δικτύων ροής” (generative flow networks) που μπορούν να κατασκευάσουν και να χρησιμοποιήσουν εσωτερικά “μοντέλα του κόσμου” (world models).
Άλλες προσεγγίσεις περιλαμβάνουν την ανάπτυξη συστημάτων που δεν θα εξαρτώνται αποκλειστικά από εξωτερικά δεδομένα, αλλά θα είναι σε θέση να δημιουργούν τα δικά τους δεδομένα μέσω εσωτερικών προσομοιώσεων και αντιπαραθέσεων υποθετικών σεναρίων (counterfactuals).
Κίνδυνοι και ηθικά ζητήματα
Η δημιουργία της AGI εγείρει σοβαρές ανησυχίες σχετικά με την ασφάλεια και τη ρύθμιση. Ο Μπενγκιό τονίζει την ανάγκη για δημοκρατική ρύθμιση της χρήσης της AGI, ώστε να διασφαλιστεί η ασφάλεια του κοινού. Μερικές από τις προτάσεις περιλαμβάνουν τη δημιουργία “μηχανισμών ασφάλειας” στα ίδια τα μοντέλα, τα οποία θα απορρίπτουν ενέργειες που ενέχουν υψηλό κίνδυνο.
Πόσο κοντά είμαστε στην AGI;
Ενώ η AGI παραμένει θεωρητικά δυνατή, η χρονική της άφιξη είναι αβέβαιη. Κάποιοι ερευνητές υποστηρίζουν ότι μπορεί να είναι μόλις λίγα χρόνια μακριά, ενώ άλλοι προβλέπουν ότι θα χρειαστούν δεκαετίες. Ο Φρανσουά Σολέ πιστεύει ότι η AGI δεν θα εμφανιστεί ξαφνικά, αλλά σταδιακά.
Η προοπτική της AGI ενθουσιάζει και φοβίζει ταυτόχρονα. Όταν φτάσει, θα αλλάξει τον κόσμο με τρόπους που είναι δύσκολο να προβλεφθούν.















