Η startup δισεκατομμυρίων δολαρίων με μια διαφορετική ιδέα για την Τεχνητή Νοημοσύνη
Η χρηματοδότηση ενός δισεκατομμυρίου δολαρίων για μια startup που απασχολεί μόλις 12 άτομα δείχνει ότι οι επενδυτές εξακολουθούν να έχουν πίστη στην Τεχνητή Νοημοσύνη. Ωστόσο, ο ιδρυτής της εν λόγω startup, ο Yann LeCun της AMI Labs, πιστεύει ότι η τεχνολογία που σήμερα ονομάζουμε Τεχνητή Νοημοσύνη (μεγάλα γλωσσικά μοντέλα) δεν είναι ο δρόμος για την ανάπτυξη ουσιαστικών και μακροπρόθεσμων αποτελεσμάτων. Ο Yann LeCun άφησε τη θέση του ως επικεφαλής επιστήμονας AI στη Meta στα τέλη του περασμένου έτους και ίδρυσε το Advanced Machine Intelligence Labs (AMI Labs), το οποίο, όπως δηλώνει, θα παραμείνει μια ερευνητική οργάνωση που δεν αναμένεται να παράγει ένα προϊόν προς πώληση για ίσως πέντε χρόνια. Η ομάδα της AMI Labs επικεντρώνεται όχι σε μεγάλα, γενικής χρήσης γλωσσικά μοντέλα, αλλά σε AI που αποτελούνται από συλλογές αρθρωτών στοιχείων, εκπαιδευμένων και λειτουργούντων σε συγκεκριμένες περιπτώσεις χρήσης.
Η πρόταση του Yann LeCun για ένα νέο σύστημα Τεχνητής Νοημοσύνης
Το προτεινόμενο σύστημα τεχνητής νοημοσύνης του LeCun θα αποτελείται από διάφορους τύπους στοιχείων, όπως ένα μοντέλο κόσμου ειδικό για τον τομέα στον οποίο θα λειτουργεί η AI. Αυτό μπορεί να είναι ειδικό για τη βιομηχανία ή, πιο πιθανό, ειδικό για το ρόλο. Ένας παράγοντας που προτείνει τα επόμενα βήματα βασισμένος στην κλασική ενίσχυση μάθησης, ένας κριτής που αναλύει τις διάφορες επιλογές που προκύπτουν από το μοντέλο του κόσμου και βασίζεται στη βραχυπρόθεσμη μνήμη, και αξιολογεί τα προτεινόμενα βήματα σύμφωνα με κανόνες που έχουν κωδικοποιηθεί. Ένα σύστημα αντίληψης που θα είναι ειδικό για τη χρήση της AI: δεδομένα βίντεο ή ήχου, κείμενο, εικόνες κ.λπ., χρησιμοποιώντας, για παράδειγμα, αλγόριθμους αναγνώρισης όρασης βαθιάς μάθησης. Μια βραχυπρόθεσμη μνήμη και ένας διαμορφωτής που θα συντονίζει την κίνηση των πληροφοριών μεταξύ των παραπάνω.
Τα πλεονεκτήματα των εξειδικευμένων μοντέλων AI
Σε αντίθεση με τα μεγάλα γλωσσικά μοντέλα που έχουν εκπαιδευτεί σε μία μόνο πηγή πληροφοριών (το κείμενο που συλλέγεται από το διαδίκτυο), κάθε περίπτωση της AI του LeCun θα λαμβάνει κατευθυνόμενα δεδομένα που αφορούν μόνο το περιβάλλον και τον σκοπό τους. Σε κάθε έκδοση, η σημασία κάθε μονάδας μπορεί να οριστεί διαφορετικά. Για παράδειγμα, η μονάδα κριτικής θα είναι πιο ολοκληρωμένη σε περιοχές που χειρίζονται ευαίσθητες πληροφορίες, ή η μονάδα αντίληψης θα είναι πρωταρχική σε συστήματα που πρέπει να αντιδρούν γρήγορα σε πραγματικά γεγονότα.
Η εκπαίδευση των μονάδων AI για ειδικές εφαρμογές
Κάθε μονάδα θα εκπαιδεύεται με τρόπους που είναι σχετικοί με το συγκεκριμένο πεδίο της AI. Υπήρξαν αρκετές επιτυχημένες περιπτώσεις αυτού στο παρελθόν, όπως τα συστήματα μηχανικής μάθησης που μπορούν να μάθουν μόνα τους πώς να παίζουν ένα βιντεοπαιχνίδι ή επιτραπέζιο παιχνίδι, για παράδειγμα. Αυτά έρχονται σε αντίθεση με τα μεγάλα γλωσσικά μοντέλα που υποστηρίζουν τη συντριπτική πλειονότητα όσων συζητάμε σήμερα όταν μιλάμε για AI.
Οι οικονομικές επιπτώσεις των νέων μεθόδων AI
Οι οικονομικές επιπτώσεις των AI που παράγονται από τις μεθόδους που προτείνει η AMI Labs θα είναι ενδιαφέρουσες για τη σημερινή βιομηχανία AI, υποθέτοντας ότι οι ιδέες του Yann LeCun παράγουν καρποφόρα και βιώσιμα αποτελέσματα. Τα μεγάλα γλωσσικά μοντέλα από μεγάλους τεχνολογικούς παρόχους (Anthropic, Meta, OpenAI, Google κ.λπ.) έχουν καταναλώσει περισσότερους πόρους με κάθε επανάληψη τα τελευταία πέντε χρόνια. Εκτός από την αύξηση του μεγέθους των μοντέλων στα αρχικά στάδια, η αναδρομική προτροπή που είναι απαραίτητη για τη βελτίωση των αποτελεσμάτων από τις μεταγενέστερες εκδόσεις τους σημαίνει ότι η εκπαίδευση και η λειτουργία μεγάλων μοντέλων γίνεται ολοένα και πιο δαπανηρή, και μόνο οι μεγάλες επιχειρήσεις μπορούν να τα λειτουργήσουν με οικονομική ζημία.
Συμπεράσματα και μελλοντικές προοπτικές για την AI
Οι μικρότερες, εξειδικευμένες μονάδες στο προτεινόμενο σύστημα της AMI Labs θα μπορούσαν να λειτουργήσουν με ένα κλάσμα της ισχύος GPU που είναι απαραίτητη για τα γιγαντιαία LLMs, ή ακόμα και σε συσκευές. Αντί για τα μοντέλα με εκατοντάδες δισεκατομμύρια παραμέτρους που χρησιμοποιεί το ChatGPT, για παράδειγμα, τα εξειδικευμένα μοντέλα – που δεν χρειάζεται να είναι γενικευμένα – θα χρειάζονται μόνο μερικές εκατοντάδες εκατομμύρια παραμέτρους. Αυτό, και η υπόθεση ότι το κόστος της πληροφορικής θα μειωθεί γενικά, σημαίνει ότι η τοπική, φθηνή και εγγενώς πιο ακριβής AI μπορεί να είναι μόνο ένα μικρό βήμα μακριά. Μια startup με μια νέα ιδέα που συγκεντρώνει τεράστια χρηματοδότηση δεν είναι κάτι νέο στην πρόσφατη ιστορία της τεχνολογίας. Αλλά τουλάχιστον μέρος της στρατηγικής του LeCun βασίζεται στην πεποίθησή του ότι τα τρέχοντα μεγάλα γλωσσικά μοντέλα δεν μπορούν να βελτιωθούν αρκετά για να πραγματοποιήσουν τις φιλόδοξες αξιώσεις των δημιουργών τους. Η AMI Labs φαίνεται να προσφέρει στους επενδυτές έναν τρόπο με τον οποίο η AI μπορεί να αποδώσει επιτυχώς σε κάποιο στάδιο στο κοντινό μέλλον με διαχειρίσιμο κόστος, χρησιμοποιώντας μια διαφορετική αρχιτεκτονική από την τρέχουσα κανονικότητα. Είναι μια διαφορετική πρόταση από αυτή που υπάρχει σήμερα από τους γίγαντες της AI, αλλά το μήνυμα της μελλοντικής δυνατότητας είναι παρόμοιο.












