Παρουσίαση των gpt-oss-120b και gpt-oss-20b: Προωθώντας τα Όρια των Μοντέλων Λογικής με «Ανοικτό Βάρος»
Η κυκλοφορία των gpt-oss-120b και gpt-oss-20b αποτελεί ένα σημαντικό βήμα προς τα εμπρός για τα μοντέλα γλώσσας με «ανοικτό βάρος», προσφέροντας εξαιρετική απόδοση σε πραγματικές συνθήκες με χαμηλό κόστος. Αυτά τα μοντέλα, διαθέσιμα υπό την ευέλικτη άδεια Apache 2.0, υπερέχουν σε εργασίες λογικής, επιδεικνύουν ισχυρές δυνατότητες χρήσης εργαλείων και είναι βελτιστοποιημένα για αποδοτική ανάπτυξη σε καταναλωτικό υλικό. Εκπαιδεύτηκαν με συνδυασμό ενισχυτικής μάθησης και τεχνικών που εμπνέονται από τα πιο προηγμένα εσωτερικά μοντέλα της OpenAI, συμπεριλαμβανομένων των o3 και άλλων πρωτοποριακών συστημάτων.
Επίδοση και Συμβατότητα των Μοντέλων gpt-oss
Το μοντέλο gpt-oss-120b επιτυγχάνει σχεδόν ισοτιμία με το OpenAI o4-mini σε βασικά πρότυπα λογικής, ενώ λειτουργεί αποδοτικά σε μία μόνο GPU 80 GB. Το gpt-oss-20b παρέχει παρόμοια αποτελέσματα με το OpenAI o3-mini σε κοινά πρότυπα και μπορεί να λειτουργήσει σε συσκευές άκρης με μόλις 16 GB μνήμης, καθιστώντας το ιδανικό για περιπτώσεις χρήσης σε συσκευές, τοπική πρόβλεψη ή γρήγορη επανάληψη χωρίς ακριβή υποδομή. Και τα δύο μοντέλα αποδίδουν επίσης ισχυρά στη χρήση εργαλείων, στην κλήση λειτουργιών με λίγα παραδείγματα, στη λογική CoT και στο HealthBench.
Αυτά τα μοντέλα είναι συμβατά με το API Responses και σχεδιάστηκαν για χρήση σε ροές εργασιών με εξαιρετική παρακολούθηση οδηγιών, χρήση εργαλείων όπως αναζήτηση στο web ή εκτέλεση κώδικα Python, και δυνατότητες λογικής. Είναι πλήρως προσαρμόσιμα, παρέχουν πλήρη αλυσίδα σκέψης (CoT) και υποστηρίζουν Δομημένα Αποτελέσματα.
Ασφάλεια και Εκπαίδευση των Μοντέλων gpt-oss
Η ασφάλεια είναι θεμελιώδης για την προσέγγισή μας στην κυκλοφορία όλων των μοντέλων μας, και είναι ιδιαίτερα σημαντική για τα ανοικτά μοντέλα. Εκτός από την εκτέλεση των μοντέλων μέσω εκτεταμένης εκπαίδευσης και αξιολογήσεων ασφαλείας, εισαγάγαμε επίσης ένα επιπλέον στρώμα αξιολόγησης δοκιμάζοντας μια εκδοχή του gpt-oss-120b που έχει βελτιωθεί με αντιπαραθετική εκπαίδευση.
Τα μοντέλα gpt-oss επιδεικνύουν συγκρίσιμη απόδοση με τα πρωτοποριακά μοντέλα μας σε εσωτερικά πρότυπα ασφαλείας, προσφέροντας στους προγραμματιστές τα ίδια πρότυπα ασφαλείας με τα πρόσφατα ιδιόκτητα μοντέλα μας. Μοιραζόμαστε τα αποτελέσματα αυτής της εργασίας και περισσότερες λεπτομέρειες σε μια ερευνητική εργασία και στην κάρτα μοντέλου. Η μεθοδολογία μας εξετάστηκε από εξωτερικούς ειδικούς και αποτελεί ένα βήμα προς τα εμπρός στη θέσπιση νέων προτύπων ασφαλείας για μοντέλα με «ανοικτό βάρος».
Συνεργασία και Εφαρμογές των Μοντέλων gpt-oss
Έχουμε συνεργαστεί με πρώιμους εταίρους όπως η AI Sweden, η Orange και η Snowflake για να μάθουμε για τις πραγματικές εφαρμογές των ανοικτών μοντέλων μας, από τη φιλοξενία αυτών των μοντέλων στις εγκαταστάσεις για την ασφάλεια των δεδομένων μέχρι την εξειδίκευση τους σε ειδικά σύνολα δεδομένων. Είμαστε ενθουσιασμένοι που παρέχουμε αυτά τα κορυφαία ανοικτά μοντέλα για να ενδυναμώσουμε όλους, από μεμονωμένους προγραμματιστές μέχρι μεγάλες επιχειρήσεις και κυβερνήσεις, να λειτουργούν και να προσαρμόζουν την AI στη δική τους υποδομή.
Διαθεσιμότητα και Υποστήριξη των Μοντέλων gpt-oss
Τα βάρη για τα gpt-oss-120b και gpt-oss-20b είναι ελεύθερα διαθέσιμα για λήψη στο Hugging Face και έρχονται εγγενώς ποσοτικοποιημένα σε MXFP4. Αυτό επιτρέπει στο μοντέλο gpt-oss-120B να λειτουργεί εντός 80GB μνήμης, ενώ το gpt-oss-20b απαιτεί μόνο 16GB. Τα μοντέλα έχουν εκπαιδευτεί στο πρότυπο εντολών harmony και ανοίγουμε τον κώδικα ενός renderer harmony σε Python και Rust για να διευκολύνουμε την υιοθέτηση.
Σχεδιάσαμε αυτά τα μοντέλα να είναι ευέλικτα και εύκολα στη λειτουργία οπουδήποτε—τοπικά, σε συσκευή ή μέσω παρόχων πρόβλεψης τρίτων. Για να υποστηρίξουμε αυτό, συνεργαστήκαμε πριν από την κυκλοφορία με κορυφαίες πλατφόρμες ανάπτυξης όπως οι Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, και OpenRouter για να κάνουμε τα μοντέλα ευρέως προσβάσιμα στους προγραμματιστές.
Συμπεράσματα και Προοπτικές για τα Μοντέλα gpt-oss
Η κυκλοφορία των gpt-oss-120b και gpt-oss-20b σηματοδοτεί ένα σημαντικό βήμα προς τα εμπρός για τα μοντέλα «ανοιχτού βάρους». Σε αυτό το μέγεθος, αυτά τα μοντέλα παρέχουν ουσιαστικές προόδους τόσο στις δυνατότητες λογικής όσο και στην ασφάλεια. Τα ανοικτά μοντέλα συμπληρώνουν τα φιλοξενούμενα μοντέλα μας, δίνοντας στους προγραμματιστές ένα ευρύτερο φάσμα εργαλείων για να επιταχύνουν την έρευνα αιχμής, να ενισχύσουν την καινοτομία και να επιτρέψουν την ασφαλέστερη, πιο διαφανή ανάπτυξη AI σε ένα ευρύ φάσμα περιπτώσεων χρήσης.
Αυτά τα ανοικτά μοντέλα μειώνουν επίσης τα εμπόδια για αναδυόμενες αγορές, τομείς με περιορισμένους πόρους και μικρότερους οργανισμούς που μπορεί να μην διαθέτουν τον προϋπολογισμό ή την ευελιξία να υιοθετήσουν ιδιόκτητα μοντέλα. Με ισχυρά, προσβάσιμα εργαλεία στα χέρια τους, οι άνθρωποι σε όλο τον κόσμο μπορούν να χτίσουν, να καινοτομήσουν και να δημιουργήσουν νέες ευκαιρίες για τους ίδιους και τους άλλους.















