Η DeepSeek Επιστρέφει στη Nvidia για το Μοντέλο R2 μετά την Αποτυχία του Τσιπ Τεχνητής Νοημοσύνης της Huawei
Η DeepSeek, μια από τις κορυφαίες εταιρείες τεχνητής νοημοσύνης της Κίνας, αναγκάστηκε να επιστρέψει στη χρήση των συστημάτων της Nvidia για το εκπαιδευτικό μοντέλο R2, μετά την αποτυχία των τσιπ Ascend της Huawei. Η αρχική πρόθεση της εταιρείας ήταν να χρησιμοποιήσει τις τεχνολογίες της Huawei για την εκπαίδευση του νέου της μοντέλου, αλλά οι τεχνικές δυσκολίες που προέκυψαν καθυστέρησαν την κυκλοφορία του. Η Κίνα προωθεί την ιδέα της τεχνολογικής αυτονομίας, αλλά η πραγματικότητα συχνά αποδεικνύεται πιο περίπλοκη. Το παράδειγμα της DeepSeek είναι χαρακτηριστικό της σύγκρουσης μεταξύ φιλοδοξίας και τεχνικών περιορισμών.
Οι Προκλήσεις της DeepSeek με τα Τσιπ της Huawei
Μετά την επιτυχημένη κυκλοφορία του μοντέλου R1 τον Ιανουάριο, η DeepSeek βρέθηκε υπό πίεση από την κινεζική κυβέρνηση να υποστηρίξει την εθνική τεχνολογία. Τρεις πηγές ανέφεραν στους Financial Times ότι η εντολή ήταν σαφής: να χρησιμοποιηθούν τα τσιπ της Huawei αντί για αυτά της Nvidia. Ωστόσο, κατά τη διάρκεια της εκπαίδευσης του νέου μοντέλου R2, η DeepSeek αντιμετώπισε «επίμονες τεχνικές δυσκολίες» με τα τσιπ της Huawei, οι οποίες ήταν τόσο σοβαρές που το έργο σταμάτησε. Ένας γνώστης της κατάστασης ανέφερε ότι αυτός ήταν ο κύριος λόγος για την ακύρωση της προγραμματισμένης κυκλοφορίας του μοντέλου τον Μάιο, αφήνοντας την εταιρεία πίσω σε έναν ανταγωνιστικό τομέα που δεν περιμένει κανέναν.
Η Διαφορά Μεταξύ Εκπαίδευσης και Υπόθεσης στην Τεχνητή Νοημοσύνη
Για να κατανοήσει κανείς τη σημασία αυτής της κατάστασης, πρέπει να γνωρίζει τη διαφορά μεταξύ εκπαίδευσης και υπόθεσης στην τεχνητή νοημοσύνη. Η εκπαίδευση είναι η πιο απαιτητική φάση, απαιτώντας τεράστια ποσά ενέργειας και σταθερότητας, ενώ η υπόθεση είναι σχετικά πιο απλή. Η DeepSeek διαπίστωσε ότι, ενώ τα τσιπ της Huawei μπορεί να είναι κατάλληλα για την τελική φάση, δεν ήταν έτοιμα για την απαιτητική διαδικασία της εκπαίδευσης. Η εταιρεία αναγκάστηκε να επιστρέψει στα ισχυρά συστήματα της Nvidia για την εκπαίδευση, ενώ συνεχίζει να προσπαθεί να χρησιμοποιήσει τα τσιπ της Huawei για την λιγότερο απαιτητική φάση της υπόθεσης.
Η Συμβολή της Huawei και οι Επιπτώσεις στην Αγορά
Δύο άτομα επιβεβαίωσαν ότι η Huawei έστειλε τη δική της ομάδα μηχανικών στα γραφεία της DeepSeek για να βοηθήσουν στην εκπαίδευση του μοντέλου R2 στα τσιπ τους. Παρά την παρουσία των ειδικών, δεν κατόρθωσαν να επιτύχουν μια επιτυχημένη εκπαίδευση. Στον κλάδο, αυτό δεν αποτελεί μεγάλη έκπληξη. Ο CEO της Huawei, Ren Zhengfei, είχε δηλώσει νωρίτερα φέτος ότι οι ΗΠΑ «έχουν υπερβάλλει για τα επιτεύγματα της Huawei» και ότι η εταιρεία «δεν είναι ακόμη τόσο μεγάλη», σημειώνοντας ότι τα καλύτερα τσιπ της είναι μια γενιά πίσω.
Η Στρατηγική της Κίνας για Τεχνολογική Αυτονομία
Παρά τα προβλήματα, το Πεκίνο συνεχίζει να προωθεί τις τοπικές τεχνολογίες, με την Financial Times να αναφέρει ότι οι εταιρείες πρέπει πλέον να αιτιολογούν τις παραγγελίες των εξαγώγιμων τσιπ H20 της Nvidia. Αυτή είναι μια στρατηγική για την οικοδόμηση ενός εγχώριου πρωταθλητή, αλλά μπορεί να αναγκάσει τις εταιρείες να κάνουν τεχνικά κατώτερες επιλογές. Εκτός από τα προβλήματα με τη χρήση των τσιπ της Huawei για την εκπαίδευση, ο ιδρυτής της DeepSeek, Liang Wenfeng, φέρεται να έχει εκφράσει τη δυσαρέσκειά του για την πρόοδο προς το μοντέλο R2, πιέζοντας την ομάδα του να στοχεύσει υψηλότερα και να δημιουργήσει κάτι που θα κρατήσει την εταιρεία ανάμεσα στους ηγέτες της βιομηχανίας τεχνητής νοημοσύνης.
Συμπεράσματα: Η Πραγματικότητα της Τεχνολογικής Ανάπτυξης
Παρά τις εντολές από την κορυφή και την εθνική υπερηφάνεια, οι νόμοι της μηχανικής εξακολουθούν να ισχύουν. Η ιστορία της DeepSeek υπενθυμίζει ότι στον παγκόσμιο αγώνα για την κυριαρχία στην τεχνητή νοημοσύνη, δεν υπάρχουν συντομεύσεις. Η Κίνα παίζει το μακροπρόθεσμο παιχνίδι, αλλά προς το παρόν, το στέμμα της απόδοσης παραμένει σταθερά στα χέρια της Nvidia.