Η OpenAI ανακοίνωσε την Τρίτη την κυκλοφορία του Advanced Voice Mode (AVM) σε μεγαλύτερο αριθμό πληρωμένων χρηστών του ChatGPT. Το νέο αυτό χαρακτηριστικό ήχου, που καθιστά το ChatGPT πιο φυσικό στην επικοινωνία, θα διατεθεί αρχικά στους χρήστες των επιπέδων Plus και Teams. Οι εταιρικοί και εκπαιδευτικοί πελάτες θα αρχίσουν να έχουν πρόσβαση την επόμενη εβδομάδα. Ως μέρος της κυκλοφορίας, το AVM αποκτά έναν ανανεωμένο σχεδιασμό. Το χαρακτηριστικό πλέον αναπαριστάται από μια μπλε κινούμενη σφαίρα, αντί για τις μαύρες κινούμενες κουκκίδες που παρουσίασε η OpenAI κατά την επίδειξη της τεχνολογίας τον Μάιο.
Νέα Χαρακτηριστικά και Φωνές
Οι χρήστες θα λάβουν μια ειδοποίηση στην εφαρμογή ChatGPT, δίπλα στο εικονίδιο φωνής, όταν το AVM γίνει διαθέσιμο σε αυτούς. Το ChatGPT αποκτά επίσης πέντε νέες φωνές που οι χρήστες μπορούν να δοκιμάσουν: Arbor, Maple, Sol, Spruce και Vale. Αυτό αυξάνει τον συνολικό αριθμό φωνών του ChatGPT σε εννέα, σχεδόν όσες έχει και το Google Gemini Live. Οι υπόλοιπες φωνές είναι οι Breeze, Juniper, Cove και Ember. Αξίζει να σημειωθεί ότι όλα αυτά τα ονόματα είναι εμπνευσμένα από τη φύση, κάτι που μπορεί να σχετίζεται με τον στόχο του AVM να κάνει τη χρήση του ChatGPT να αισθάνεται πιο φυσική.
Νομικές Προκλήσεις και Απουσίες
Μια φωνή που λείπει από αυτή τη λίστα είναι η Sky, η οποία παρουσιάστηκε κατά την ενημέρωση της άνοιξης από την OpenAI. Η ηθοποιός Scarlett Johansson, που έπαιξε ένα σύστημα τεχνητής νοημοσύνης στην ταινία “Her”, ισχυρίστηκε ότι η φωνή της Sky έμοιαζε υπερβολικά με τη δική της, οδηγώντας σε νομική απειλή. Η OpenAI αφαίρεσε γρήγορα τη φωνή της Sky, δηλώνοντας ότι δεν είχε σκοπό να μοιάζει με τη φωνή της Johansson, παρά τις αναφορές στο φιλμ από αρκετά μέλη του προσωπικού σε tweets εκείνη την εποχή.
Ελλείποντα Χαρακτηριστικά και Βελτιώσεις
Ένα άλλο χαρακτηριστικό που λείπει από αυτή την κυκλοφορία είναι το βίντεο και η κοινή χρήση οθόνης του ChatGPT, που η OpenAI παρουσίασε κατά την ενημέρωση της άνοιξης πριν από τέσσερις μήνες. Αυτό το χαρακτηριστικό υποτίθεται ότι θα επιτρέπει στο GPT-4 να επεξεργάζεται ταυτόχρονα οπτικές και ακουστικές πληροφορίες. Κατά την επίδειξη, ένα μέλος του προσωπικού της OpenAI έδειξε πώς θα μπορούσατε να κάνετε ερωτήσεις στο ChatGPT σε πραγματικό χρόνο σχετικά με μαθηματικά σε ένα κομμάτι χαρτί μπροστά σας ή κώδικα στην οθόνη του υπολογιστή σας. Προς το παρόν, η OpenAI δεν προσφέρει χρονοδιάγραμμα για την κυκλοφορία αυτών των πολυτροπικών δυνατοτήτων.
Βελτιώσεις και Προσαρμογές
Η OpenAI αναφέρει ότι έχει κάνει κάποιες βελτιώσεις από την κυκλοφορία της περιορισμένης alpha έκδοσης του AVM. Το χαρακτηριστικό φωνής του ChatGPT είναι πλέον καλύτερο στην κατανόηση διαλέκτων και η εταιρεία λέει ότι οι συνομιλίες είναι πιο ομαλές και γρήγορες. Κατά τις δοκιμές μας με το AVM, διαπιστώσαμε ότι τα σφάλματα δεν ήταν ασυνήθιστα, αλλά η εταιρεία ισχυρίζεται ότι αυτό έχει βελτιωθεί.
Η OpenAI επεκτείνει επίσης ορισμένα από τα χαρακτηριστικά προσαρμογής του ChatGPT στο AVM: οι Προσαρμοσμένες Οδηγίες, που επιτρέπουν στους χρήστες να εξατομικεύουν τον τρόπο με τον οποίο το ChatGPT ανταποκρίνεται σε αυτούς, και η Μνήμη, που επιτρέπει στο ChatGPT να θυμάται συνομιλίες για μελλοντική αναφορά.
Περιορισμοί Διάθεσης
Ένας εκπρόσωπος της OpenAI δήλωσε ότι το AVM δεν είναι ακόμη διαθέσιμο σε αρκετές περιοχές, συμπεριλαμβανομένων της ΕΕ, του Ηνωμένου Βασιλείου, της Ελβετίας, της Ισλανδίας, της Νορβηγίας και του Λιχτενστάιν.
Συμπέρασμα
Η κυκλοφορία του Advanced Voice Mode από την OpenAI φέρνει σημαντικές βελτιώσεις στην επικοινωνία με το ChatGPT, καθιστώντας το πιο φυσικό και προσαρμόσιμο. Παρά τις προκλήσεις και τις ελλείψεις, η OpenAI συνεχίζει να βελτιώνει την εμπειρία χρήστη και να επεκτείνει τις δυνατότητες του ChatGPT. Αναμένουμε με ενδιαφέρον τις μελλοντικές αναβαθμίσεις και τις νέες δυνατότητες που θα προσφέρει αυτή η τεχνολογία.















