Η Ελβετία παρουσιάζει ένα νέο ανοικτό μοντέλο τεχνητής νοημοσύνης για την έρευνα και τις εφαρμογές
Μια ομάδα ελβετικών ιδρυμάτων έχει λανσάρει ένα νέο ανοικτό μοντέλο τεχνητής νοημοσύνης, σχεδιασμένο να αποτελέσει τη βάση για μελλοντική έρευνα και εφαρμογές. Το μοντέλο, που φέρει το όνομα Apertus – λατινικά για “ανοικτό” – αναπτύχθηκε από το EPFL, το ETH Zurich και το Ελβετικό Εθνικό Κέντρο Υπερυπολογιστών (CSCS). Το όνομα του μοντέλου αντικατοπτρίζει την κύρια αρχή του: κάθε μέρος του σχεδιασμού και της διαδικασίας εκπαίδευσής του είναι προσβάσιμο στο κοινό. Οι προγραμματιστές και οι οργανισμοί μπορούν να χρησιμοποιήσουν το Apertus για τη δημιουργία chatbots, εργαλείων μετάφρασης ή εφαρμογών με εκπαιδευτικό προσανατολισμό. Το μοντέλο είναι διαθέσιμο για λήψη από το Hugging Face ή μέσω της Swisscom, στρατηγικού εταίρου της πρωτοβουλίας. Διατίθενται δύο εκδόσεις – ένα μοντέλο με 8 δισεκατομμύρια παραμέτρους και μια μεγαλύτερη έκδοση με 70 δισεκατομμύρια παραμέτρους. Και οι δύο εκδόσεις κυκλοφορούν υπό μια ελεύθερη άδεια ανοικτού κώδικα, επιτρέποντας τη χρήση τους σε έρευνα, εκπαίδευση και εμπορικά έργα.
Το Apertus: Ένα πλήρως ανοικτό μοντέλο τεχνητής νοημοσύνης με διαφάνεια και προσβασιμότητα
Σε αντίθεση με άλλα συστήματα τεχνητής νοημοσύνης που αποκαλύπτουν μόνο επιλεγμένες λεπτομέρειες, το Apertus είναι ένα πλήρως ανοικτό μοντέλο τεχνητής νοημοσύνης, με την αρχιτεκτονική του, τα δεδομένα εκπαίδευσης και την τεκμηρίωση διαθέσιμα για επιθεώρηση. Ο Martin Jaggi, Καθηγητής Μηχανικής Μάθησης στο EPFL και μέλος της Διοικούσας Επιτροπής της Ελβετικής Πρωτοβουλίας Τεχνητής Νοημοσύνης, δήλωσε ότι με αυτή την κυκλοφορία, επιδιώκουν να παρέχουν ένα πρότυπο για το πώς μπορεί να αναπτυχθεί ένα αξιόπιστο, κυρίαρχο και περιεκτικό μοντέλο τεχνητής νοημοσύνης. Το Apertus θα ενημερώνεται τακτικά από μια ομάδα μηχανικών και ερευνητών από το CSCS, το ETH Zurich και το EPFL. Ο Thomas Schulthess, Διευθυντής του CSCS και Καθηγητής στο ETH Zurich, περιέγραψε το Apertus ως “ένα μοχλό καινοτομίας και ένα μέσο ενίσχυσης της τεχνογνωσίας στην τεχνητή νοημοσύνη στην έρευνα, την κοινωνία και τη βιομηχανία”.
Πολυγλωσσική προσέγγιση και η σημασία της για την τεχνητή νοημοσύνη
Η διαδικασία εκπαίδευσης του μοντέλου περιλάμβανε 15 τρισεκατομμύρια tokens σε περισσότερες από 1.000 γλώσσες, με περίπου το 40% των δεδομένων να είναι σε μη αγγλικές γλώσσες. Το Apertus περιλαμβάνει γλώσσες που συχνά παραλείπονται από τα μεγάλα γλωσσικά μοντέλα, όπως τα ελβετικά γερμανικά και τα ρομανικά. Ο Imanol Schlag, τεχνικός επικεφαλής του έργου και Ερευνητής στο ETH Zurich, ανέφερε ότι το Apertus είναι κατασκευασμένο για το δημόσιο καλό. Είναι ένα από τα λίγα πλήρως ανοικτά μεγάλα γλωσσικά μοντέλα σε αυτή την κλίμακα και το πρώτο του είδους του που ενσωματώνει την πολυγλωσσία, τη διαφάνεια και τη συμμόρφωση ως θεμελιώδεις αρχές σχεδίασης. Η Swisscom ήδη αναπτύσσει το Apertus στην κυρίαρχη πλατφόρμα τεχνητής νοημοσύνης της, υπογραμμίζοντας τη δέσμευσή της να διαμορφώσει ένα ασφαλές και υπεύθυνο οικοσύστημα τεχνητής νοημοσύνης που εξυπηρετεί το δημόσιο συμφέρον και ενισχύει την ψηφιακή κυριαρχία της Ελβετίας.
Πρόσβαση και πραγματική χρήση του ανοικτού μοντέλου τεχνητής νοημοσύνης
Ενώ η λήψη του Apertus είναι απλή για έμπειρους χρήστες, η πρακτική χρήση απαιτεί διακομιστές, πόρους cloud ή ειδικές διεπαφές. Οι προγραμματιστές θα μπορούν να δοκιμάσουν το Apertus κατά τη διάρκεια των Ελβετικών Εβδομάδων Τεχνητής Νοημοσύνης, οι οποίες συνεχίζονται μέχρι τις 5 Οκτωβρίου 2025. Οι συμμετέχοντες σε hackathon θα έχουν πρόσβαση μέσω μιας διεπαφής που φιλοξενείται από τη Swisscom. Οι επιχειρηματικοί πελάτες της Swisscom μπορούν επίσης να αρχίσουν να χρησιμοποιούν το μοντέλο σήμερα μέσω της πλατφόρμας τεχνητής νοημοσύνης της εταιρείας. Για διεθνείς χρήστες, το Apertus θα είναι διαθέσιμο μέσω της Δημόσιας Υπηρεσίας Υπολογιστικής Τεχνητής Νοημοσύνης. Ο Joshua Tan, Κύριος Συντηρητής της Δημόσιας Υπηρεσίας Υπολογιστικής Τεχνητής Νοημοσύνης, δήλωσε ότι το Apertus είναι το κορυφαίο δημόσιο μοντέλο τεχνητής νοημοσύνης: ένα μοντέλο που κατασκευάστηκε από δημόσιους φορείς, για το δημόσιο συμφέρον.
Διαφάνεια και συμμόρφωση στο μοντέλο τεχνητής νοημοσύνης της Ελβετίας
Υπό την άδεια ανοικτού κώδικα, τα δεδομένα εκπαίδευσης, τα βάρη του μοντέλου και τα ενδιάμεσα σημεία ελέγχου είναι διαθέσιμα. Η διαδικασία εκπαίδευσης του μοντέλου ακολούθησε τους ελβετικούς κανόνες προστασίας δεδομένων, το ελβετικό δίκαιο πνευματικής ιδιοκτησίας και τις απαιτήσεις διαφάνειας της Ευρωπαϊκής Ένωσης για την τεχνητή νοημοσύνη. Το σύνολο δεδομένων περιορίστηκε σε δημόσια διαθέσιμες πληροφορίες, φιλτραρίστηκε για να αφαιρεθούν προσωπικά δεδομένα και να τιμηθούν οι αιτήσεις αποκλεισμού από ιστότοπους. Εφαρμόστηκαν επίσης ηθικές κατευθυντήριες γραμμές για τον αποκλεισμό ανεπιθύμητου υλικού πριν από την έναρξη της εκπαίδευσης.
Το μέλλον του ανοικτού μοντέλου τεχνητής νοημοσύνης της Ελβετίας
Το Apertus αποδεικνύει ότι η γενετική τεχνητή νοημοσύνη μπορεί να είναι και ισχυρή και ανοικτή, σύμφωνα με τον Antoine Bosselut, Καθηγητή στο EPFL και Συμπροεδρεύοντα της Ελβετικής Πρωτοβουλίας Τεχνητής Νοημοσύνης. Η κυκλοφορία του Apertus δεν είναι το τελικό βήμα, αλλά η αρχή ενός ταξιδιού, μια μακροπρόθεσμη δέσμευση για ανοικτές, αξιόπιστες και κυρίαρχες βάσεις τεχνητής νοημοσύνης, για το δημόσιο καλό παγκοσμίως. Οι μελλοντικές ενημερώσεις στοχεύουν στην επέκταση της οικογένειας μοντέλων, στη βελτίωση της αποδοτικότητας και στην ανάπτυξη εργαλείων ειδικών για τομέα, όπως το δίκαιο, η υγεία, το κλίμα και η εκπαίδευση, ενώ συνεχίζουν να τηρούν αυστηρά πρότυπα διαφάνειας.












