DeepSeek: Αποφεύγει να απαντήσει στο 85% των προτροπών για «ευαίσθητα θέματα»

Η τεχνητή νοημοσύνη DeepSeek προκαλεί αναταραχή σε παγκόσμιο επίπεδο και ανατρέπει τις αγορές

Η τεχνητή νοημοσύνη DeepSeek έχει κατακτήσει τον κόσμο, ανεβαίνοντας στην κορυφή των καταστημάτων εφαρμογών και προκαλώντας αναταραχή στη Σίλικον Βάλεϊ και τη Γουόλ Στριτ. Ως παρακλάδι του κινεζικού hedge fund High-Flyer, η αναλογία κόστους-απόδοσης της DeepSeek είναι εντυπωσιακή σε σύγκριση με άλλους μεγάλους παίκτες, όπως η OpenAI. Ωστόσο, αυξάνονται οι αναφορές για θέματα που το chatbot αρνείται να συζητήσει, όπως τα γεγονότα στην πλατεία Τιενανμέν και η κατάσταση της Ταϊβάν.

Η ανάλυση της PromptFoo αποκαλύπτει ελλείψεις και εθνικιστική ρητορική

Μια νέα έκθεση από την PromptFoo, μια startup που υποστηρίζεται από την Andreessen Horowitz και εστιάζει στην ανίχνευση ευπαθειών σε εφαρμογές τεχνητής νοημοσύνης, αποκάλυψε ότι το μοντέλο λογικής R1 της DeepSeek αρνήθηκε να απαντήσει στο 85% των 1.360 ευαίσθητων θεμάτων. Οι απαντήσεις του μοντέλου συχνά περιλάμβαναν έντονη εθνικιστική ρητορική. Οι ερευνητές σημείωσαν επίσης ότι το DeepSeek μπορεί εύκολα να παρακαμφθεί, υποδηλώνοντας ότι η κινεζική εταιρεία έχει εφαρμόσει λογοκρισία του Κομμουνιστικού Κόμματος με απλοϊκό τρόπο.

Το υπόβαθρο της DeepSeek και οι τεχνολογικές προκλήσεις

Η DeepSeek υποστηρίζεται από την High-Flyer Capital Management, ένα κινεζικό hedge fund που χρησιμοποιεί την τεχνητή νοημοσύνη για να καθοδηγεί τις επενδυτικές του αποφάσεις. Ο Λιάνγκ Γουενφένγκ, συνιδρυτής της High-Flyer, ξεκίνησε την εταιρεία το 2015 και το 2019 εστίασε στην ανάπτυξη αλγορίθμων τεχνητής νοημοσύνης. Το 2023, η High-Flyer ίδρυσε τη DeepSeek ως εργαστήριο για την έρευνα εργαλείων τεχνητής νοημοσύνης, το οποίο στη συνέχεια έγινε ανεξάρτητη εταιρεία.

Από την αρχή, η DeepSeek δημιούργησε δικά της κέντρα δεδομένων για την εκπαίδευση των μοντέλων της. Ωστόσο, όπως και άλλες κινεζικές εταιρείες τεχνητής νοημοσύνης, έχει επηρεαστεί από τις αμερικανικές απαγορεύσεις εξαγωγών υλικού. Για την εκπαίδευση ενός από τα πρόσφατα μοντέλα της, η εταιρεία αναγκάστηκε να χρησιμοποιήσει τα λιγότερο ισχυρά τσιπ Nvidia H800.

Η ανάπτυξη και οι επιδόσεις των μοντέλων της DeepSeek

Η DeepSeek παρουσίασε την πρώτη σειρά μοντέλων της — DeepSeek Coder, DeepSeek LLM και DeepSeek Chat — τον Νοέμβριο του 2023. Ωστόσο, η βιομηχανία άρχισε να την προσέχει την επόμενη άνοιξη, με την κυκλοφορία της σειράς DeepSeek-V2, ενός συστήματος ανάλυσης κειμένου και εικόνας, που αποδείχθηκε οικονομικότερο από τα αντίστοιχα μοντέλα της εποχής.

Η νέα έκδοση DeepSeek-V3, που κυκλοφόρησε τον Δεκέμβριο του 2024, ενίσχυσε περαιτέρω τη φήμη της DeepSeek. Οι εσωτερικές δοκιμές της εταιρείας έδειξαν ότι το DeepSeek V3 ξεπερνά τόσο τα ελεύθερα διαθέσιμα μοντέλα, όπως το Llama της Meta, όσο και τα κλειστά μοντέλα που είναι προσβάσιμα μόνο μέσω API, όπως το GPT-4o της OpenAI.

Το μοντέλο λογικής R1 και οι περιορισμοί του

Εξίσου εντυπωσιακό είναι το μοντέλο λογικής R1 της DeepSeek, το οποίο κυκλοφόρησε τον Ιανουάριο. Η DeepSeek ισχυρίζεται ότι το R1 αποδίδει εξίσου καλά με το μοντέλο o1 της OpenAI σε βασικά κριτήρια. Ως μοντέλο λογικής, το R1 ελέγχει αποτελεσματικά τα δεδομένα του, αποφεύγοντας τις συνήθεις παγίδες. Αν και τα μοντέλα λογικής χρειάζονται περισσότερο χρόνο για να βρουν λύσεις, είναι πιο αξιόπιστα σε τομείς όπως η φυσική και τα μαθηματικά.

Ωστόσο, τα μοντέλα της DeepSeek, όπως το R1 και το V3, υπόκεινται σε αξιολόγηση από τον κινεζικό ρυθμιστή διαδικτύου για να διασφαλιστεί ότι οι απαντήσεις τους ενσωματώνουν τις βασικές σοσιαλιστικές αξίες. Στην εφαρμογή chatbot της DeepSeek, για παράδειγμα, το R1 δεν απαντά σε ερωτήσεις σχετικά με την πλατεία Τιενανμέν ή την αυτονομία της Ταϊβάν.

Συμπέρασμα: Η επιρροή της DeepSeek και οι προκλήσεις που αντιμετωπίζει

Η DeepSeek έχει καταφέρει να προκαλέσει έντονο ενδιαφέρον και συζήτηση με τις καινοτόμες λύσεις της στην τεχνητή νοημοσύνη, ενώ παράλληλα αντιμετωπίζει σημαντικές προκλήσεις λόγω των γεωπολιτικών περιορισμών. Καθώς συνεχίζει να αναπτύσσεται, η DeepSeek διαμορφώνει το τοπίο της τεχνητής νοημοσύνης, προσφέροντας νέες δυνατότητες αλλά και προκαλώντας ερωτήματα σχετικά με τη λογοκρισία και την ελευθερία της πληροφορίας. Οι εξελίξεις γύρω από την DeepSeek θα συνεχίσουν να παρακολουθούνται στενά, καθώς η εταιρεία προσπαθεί να ισορροπήσει μεταξύ καινοτομίας και συμμόρφωσης με τους κανονισμούς.