Η Κινεζική Τεχνολογία Τεχνητής Νοημοσύνης Ανταγωνίζεται τις ΗΠΑ
Η Κίνα συνεχίζει να ενισχύει τη θέση της στον τομέα της τεχνητής νοημοσύνης, με εταιρείες όπως η MiniMax να παρουσιάζουν μοντέλα που ανταγωνίζονται τις δυνατότητες των συστημάτων από εταιρείες των ΗΠΑ, όπως η OpenAI. Αυτή την εβδομάδα, η MiniMax, μια startup που υποστηρίζεται από κολοσσούς όπως η Alibaba και η Tencent, παρουσίασε τρία νέα μοντέλα AI. Η εταιρεία έχει συγκεντρώσει περίπου 850 εκατομμύρια δολάρια σε κεφάλαια και η αξία της υπερβαίνει τα 2,5 δισεκατομμύρια δολάρια.
Τα Νέα Μοντέλα της MiniMax και οι Δυνατότητές τους
Η MiniMax παρουσίασε τα MiniMax-Text-01, MiniMax-VL-01, και T2A-01-HD. Το MiniMax-Text-01 είναι αποκλειστικά για κείμενο, ενώ το MiniMax-VL-01 μπορεί να κατανοήσει τόσο εικόνες όσο και κείμενο. Το T2A-01-HD δημιουργεί ήχο, κυρίως ομιλία. Σύμφωνα με την εταιρεία, το MiniMax-Text-01, που διαθέτει 456 δισεκατομμύρια παραμέτρους, υπερέχει σε δοκιμές όπως το MMLU και το SimpleQA, που αξιολογούν την ικανότητα ενός μοντέλου να απαντά σε μαθηματικά προβλήματα και ερωτήσεις βασισμένες σε γεγονότα.
Η Ικανότητα Πολυτροπικής Κατανόησης του MiniMax-VL-01
Το MiniMax-VL-01 ανταγωνίζεται το Claude 3.5 Sonnet της Anthropic σε δοκιμές που απαιτούν πολυτροπική κατανόηση, όπως το ChartQA. Αυτές οι δοκιμές ζητούν από τα μοντέλα να απαντούν σε ερωτήσεις που σχετίζονται με γραφήματα και διαγράμματα. Αν και το MiniMax-VL-01 δεν ξεπερνά το Gemini 2.0 Flash σε πολλές από αυτές τις δοκιμές, καταφέρνει να σταθεί επάξια απέναντι σε άλλα μοντέλα όπως το GPT-4o και το InternVL2.5.
Η Μεγάλη Δυνατότητα Ανάλυσης Κειμένου του MiniMax-Text-01
Ιδιαίτερη εντύπωση προκαλεί το MiniMax-Text-01 με το εξαιρετικά μεγάλο παράθυρο περιεχομένου του. Το παράθυρο περιεχομένου αναφέρεται στην ποσότητα εισόδου (π.χ., κείμενο) που μπορεί να επεξεργαστεί το μοντέλο πριν παράγει έξοδο. Με παράθυρο 4 εκατομμυρίων τοκενών, το MiniMax-Text-01 μπορεί να αναλύσει περίπου 3 εκατομμύρια λέξεις σε μια φορά, δηλαδή πάνω από πέντε αντίτυπα του "Πόλεμος και Ειρήνη". Συγκριτικά, το παράθυρο περιεχομένου του είναι περίπου 31 φορές μεγαλύτερο από αυτό του GPT-4o και του Llama 3.1.
Η Δυνατότητα Δημιουργίας Ήχου του T2A-01-HD
Το T2A-01-HD είναι ένας γεννήτορας ήχου βελτιστοποιημένος για ομιλία. Μπορεί να δημιουργήσει συνθετική φωνή με ρυθμιζόμενη καδέντσα, τόνο και χροιά σε περίπου 17 διαφορετικές γλώσσες, συμπεριλαμβανομένων των αγγλικών και των κινεζικών. Μπορεί επίσης να κλωνοποιήσει μια φωνή από μόλις 10 δευτερόλεπτα ηχογράφησης. Αν και η MiniMax δεν δημοσίευσε αποτελέσματα συγκριτικών δοκιμών για το T2A-01-HD, οι παραγόμενοι ήχοι φαίνονται ισάξιοι με εκείνους από μοντέλα άλλων εταιρειών όπως η Meta.
Πρόσβαση και Περιορισμοί των Νέων Μοντέλων
Εκτός από το T2A-01-HD, που είναι διαθέσιμο μόνο μέσω της πλατφόρμας Hailuo AI της MiniMax, τα νέα μοντέλα μπορούν να κατεβούν από το GitHub και την πλατφόρμα Hugging Face. Ωστόσο, η διαθεσιμότητά τους δεν σημαίνει ότι είναι πλήρως ανοικτά. Η MiniMax δεν έχει δημοσιεύσει τα στοιχεία που απαιτούνται για την αναδημιουργία τους από την αρχή και επιβάλλει περιοριστική άδεια χρήσης.
Η Αντίδραση της Αγοράς και οι Πολιτικές Εξελίξεις
Η MiniMax ιδρύθηκε το 2021 από πρώην υπαλλήλους της SenseTime, μιας από τις μεγαλύτερες εταιρείες AI της Κίνας. Ορισμένα από τα προϊόντα της έχουν προκαλέσει αντιδράσεις. Η εφαρμογή Talkie, που αποσύρθηκε από το App Store της Apple, περιλαμβάνει AI avatars δημόσιων προσώπων χωρίς τη συγκατάθεσή τους. Επίσης, η MiniMax κατηγορείται για παράνομη εκπαίδευση των μοντέλων της με περιεχόμενο από το iQiyi.
Συμπεράσματα και Προοπτικές για το Μέλλον
Τα νέα μοντέλα της MiniMax κυκλοφόρησαν λίγο μετά την πρόταση της κυβέρνησης Μπάιντεν για αυστηρότερους κανόνες εξαγωγής τεχνολογιών AI στην Κίνα. Οι εταιρείες στην Κίνα αντιμετωπίζουν ήδη περιορισμούς στην αγορά προηγμένων τσιπ AI, και οι νέοι κανόνες θα επιβάλλουν αυστηρότερους περιορισμούς. Η MiniMax συνεχίζει να προκαλεί το ενδιαφέρον με τις καινοτομίες της, παρά τις προκλήσεις που αντιμετωπίζει.















