Google Εγκαινιάζει το Gemini 3.5: Ζωντανή Φωνητική Μετάφραση για 70 Γλώσσες
Η Google παρουσίασε το Gemini 3.5 Live Translate, ένα μοντέλο σχεδόν πραγματικού χρόνου για φωνητική μετάφραση που υποστηρίζει περισσότερες από 70 γλώσσες. Αυτή η καινοτομία επιτρέπει τη μετατροπή του προφορικού λόγου από μία γλώσσα σε άλλη, προωθώντας τη φωνητική μετάφραση με τη βοήθεια του Gemini σε καθημερινές συνομιλίες, επαγγελματικές συναντήσεις και υπηρεσίες που αναπτύσσονται από προγραμματιστές. Η νέα αυτή δυνατότητα δεν περιορίζεται μόνο σε υπότιτλους ή γραπτό κείμενο, αλλά υποστηρίζει την πλήρη μετάφραση του προφορικού λόγου.
Το Gemini 3.5 Live Translate είναι διαθέσιμο στην εφαρμογή Google Translate για Android και iOS, ενώ επιλεγμένοι επιχειρηματικοί χρήστες της σουίτας παραγωγικότητας Workspace της Google έχουν πρόσβαση σε μια ιδιωτική προεπισκόπηση στο Google Meet. Οι προγραμματιστές μπορούν να ξεκινήσουν τις δοκιμές μέσω δημόσιας προεπισκόπησης στο Gemini Live API, το οποίο αποτελεί την διεπαφή λογισμικού για ζωντανές αλληλεπιδράσεις με το Gemini, καθώς και στο Google AI Studio, το εργαλείο ανάπτυξης μοντέλων της Google.
Νέες Δυνατότητες και Εφαρμογές του Gemini 3.5 Live Translate
Το Gemini 3.5 Live Translate μπορεί να ανιχνεύσει περισσότερες από 70 γλώσσες και να διατηρήσει την εκφορά, τον ρυθμό και τον τόνο της φωνής κατά τη διάρκεια της ομιλίας. Η συνεχής μετάφραση αποφεύγει την αναμονή για την ολοκλήρωση μιας φράσης, βελτιώνοντας την ποιότητα του αποτελέσματος. Ωστόσο, οι χρήστες θα παρατηρήσουν ένα μικρό κενό λίγων δευτερολέπτων στις ζωντανές συνομιλίες, καθώς η προφορική έξοδος ακολουθεί τον αρχικό ομιλητή με μικρή καθυστέρηση.
Οι χρήστες Android απολαμβάνουν τη διαφορά με την αναπαραγωγή της μεταφρασμένης ομιλίας μέσω του ακουστικού του τηλεφώνου αντί του ενσωματωμένου ηχείου, κάτι που δεν προσφέρεται από το iOS. Αυτή η λειτουργία επιτρέπει πιο ήσυχες, προσωπικές συνομιλίες. Στο Google Meet, η κάλυψη γλωσσών θα επεκταθεί από πέντε σε περισσότερους από 2.000 συνδυασμούς γλωσσών, με επιλεγμένους πελάτες να λαμβάνουν πρώτοι την αναβάθμιση.
Διαφορετικές Διαδρομές Κυκλοφορίας για Καταναλωτές, Συναντήσεις και Προγραμματιστές
Η πρόσβαση για καταναλωτές, οι δοκιμές σε αίθουσες συναντήσεων και τα πειράματα προγραμματιστών προχωρούν με διαφορετικούς ρυθμούς. Οι χρήστες του Google Translate αποκτούν πρόσβαση μέσω της εφαρμογής, οι πελάτες του Workspace έχουν περιορισμένη πρόσβαση στο Meet, ενώ οι προγραμματιστές μπορούν να αναπτύξουν εφαρμογές μέσω του Gemini Live API και του Google AI Studio. Αυτή η προσέγγιση μετατρέπει το μοντέλο σε χαρακτηριστικό πλατφόρμας και όχι μόνο σε χαρακτηριστικό της εφαρμογής της Google.
Πλατφόρμες όπως οι Agora, Fishjam, LiveKit, Pipecat και Vision Agents θα υποστηρίξουν εφαρμογές πραγματικού χρόνου φωνητικής μετάφρασης βασισμένες στο μοντέλο. Η Grab, μια πλατφόρμα μεταφορών στη Νοτιοανατολική Ασία, δοκιμάζει ήδη το μοντέλο για την επικοινωνία μεταξύ οδηγών και επιβατών κατά την παραλαβή. Η πλατφόρμα της Grab διαχειρίζεται περισσότερες από 10 εκατομμύρια φωνητικές κλήσεις ανά μήνα, προσφέροντας στην Google ένα περιβάλλον υψηλού όγκου συνομιλιών εκτός των δικών της εφαρμογών.
Ανταγωνισμός και Έλεγχοι στον Πραγματικό Κόσμο
Σχετικά προϊόντα περιλαμβάνουν ήδη τις μεταφρασμένες λεζάντες του Zoom, τον KUDO AI Speech Translator, το Wordly AI Translation, και το προϊόν τοπικοποίησης βίντεο του HeyGen που λειτουργεί με περισσότερες από 175 γλώσσες. Το πλεονέκτημα της Google θα εξαρτηθεί από το αν ένα μοντέλο μπορεί να λειτουργήσει αξιόπιστα σε κλήσεις, συναντήσεις και εφαρμογές, και όχι μόνο σε προετοιμασμένες επιδείξεις.
Συμπέρασμα: Η Επόμενη Μέρα της Φωνητικής Μετάφρασης
Το Gemini 3.5 Live Translate της Google αποτελεί μια σημαντική εξέλιξη στον τομέα της φωνητικής μετάφρασης, προσφέροντας νέες δυνατότητες και εφαρμογές που μπορούν να αλλάξουν τον τρόπο με τον οποίο επικοινωνούμε σε διαφορετικές γλώσσες. Η τεχνολογία αυτή υπόσχεται να διευκολύνει τις διεθνείς συνομιλίες και να ανοίξει νέους δρόμους για επιχειρήσεις και προγραμματιστές. Οι χρήστες καλούνται να εξερευνήσουν τις δυνατότητες αυτής της καινοτομίας και να ανακαλύψουν πώς μπορεί να βελτιώσει την καθημερινότητά τους.













