Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

No Result
View All Result
Home Νέα

Η ElevenLabs λανσάρει το δικό της μοντέλο μετατροπής ομιλίας σε κείμενο

by Kyriakos Koutsourelis
1 Μαρτίου, 2025
in Νέα
0
Η ElevenLabs, μια νεοσύστατη επιχείρηση τεχνητής νοημοσύνης που μόλις συγκέντρωσε ένα γύρο χρηματοδότησης ύψους 180 εκατομμυρίων δολαρίων, είναι γνωστή κυρίως για τις ικανότητές της στην παραγωγή ήχου. Η εταιρεία έκανε ένα βήμα προς μια άλλη τεχνολογική κατεύθυνση λανσάροντας το πρώτο αυτόνομο μοντέλο ομιλίας σε κείμενο με την ονομασία Scribe. Η νεοφυής επιχείρηση, η αξία της οποίας αποτιμάται στα 3,3 δισεκατομμύρια δολάρια, έχει βοηθήσει πολλές άλλες εταιρείες στην παροχή υπηρεσιών speech-to-text μέσω της τεράστιας βιβλιοθήκης φωνών της. Ωστόσο, η εταιρεία επιδιώκει τώρα να εισέλθει στην ανίχνευση ομιλίας και να ανταγωνιστεί μοντέλα όπως τα Gladia, Speechmatics, AssemblyAI, Deepgram και τα μοντέλα Whisper της OpenAI. Translated with DeepL.com (free version)
Share on FacebookShare on Twitter

Η ElevenLabs Εισέρχεται στην Αγορά Αναγνώρισης Ομιλίας με το Νέο Μοντέλο Scribe

Η ElevenLabs, μια ανερχόμενη εταιρεία τεχνητής νοημοσύνης, πρόσφατα συγκέντρωσε 180 εκατομμύρια δολάρια σε μια εντυπωσιακή χρηματοδότηση. Γνωστή κυρίως για την ικανότητά της στην παραγωγή ήχου, η εταιρεία κάνει ένα νέο τεχνολογικό άλμα με την κυκλοφορία του πρώτου ανεξάρτητου μοντέλου αναγνώρισης ομιλίας, του Scribe. Η αξία της εταιρείας ανέρχεται στα 3,3 δισεκατομμύρια δολάρια και έχει ήδη βοηθήσει πολλές άλλες εταιρείες να προσφέρουν υπηρεσίες αναγνώρισης ομιλίας μέσω της εκτεταμένης βιβλιοθήκης φωνών της. Τώρα, η ElevenLabs στοχεύει να εισέλθει στην αγορά αναγνώρισης ομιλίας και να ανταγωνιστεί εταιρείες όπως οι Gladia, Speechmatics, AssemblyAI, Deepgram και τα μοντέλα Whisper της OpenAI.

Το Νέο Μοντέλο Scribe και οι Γλώσσες που Υποστηρίζει

Το μοντέλο Scribe της ElevenLabs υποστηρίζει περισσότερες από 99 γλώσσες από την αρχή. Η εταιρεία κατατάσσει πάνω από 25 γλώσσες στην κατηγορία εξαιρετικής ακρίβειας, όπου το ποσοστό σφάλματος λέξεων είναι κάτω από 5%. Σε αυτή τη λίστα περιλαμβάνονται τα Αγγλικά (με δηλωμένο ποσοστό ακρίβειας 97%), τα Γαλλικά, τα Γερμανικά, τα Χίντι, τα Ινδονησιακά, τα Ιαπωνικά, τα Κανάντα, τα Μαλαγιάλαμ, τα Πολωνικά, τα Πορτογαλικά, τα Ισπανικά και τα Βιετναμέζικα. Άλλες γλώσσες κατατάσσονται σε διαφορετικές κατηγορίες με υψηλά (5% έως 10% ποσοστά σφάλματος λέξεων), καλά (10% έως 20% ποσοστά σφάλματος λέξεων) και μέτρια (25% έως 50%) ποσοστά σφάλματος λέξεων.

Επιδόσεις και Συγκρίσεις με Άλλα Μοντέλα

Η ElevenLabs αναφέρει ότι το μοντέλο της ξεπερνάει το Google Gemini 2.0 Flash και το Whisper Large V3 σε πολλαπλές γλώσσες, σύμφωνα με τα τεστ FLEURS & Common Voice. Η εταιρεία είχε αναπτύξει το στοιχείο αναγνώρισης ομιλίας για την πλατφόρμα συνομιλητή AI που κυκλοφόρησε πέρυσι. Ωστόσο, αυτή είναι η πρώτη φορά που η εταιρεία κυκλοφορεί ένα ανεξάρτητο μοντέλο ανίχνευσης ομιλίας.

Στοχεύοντας στη Βελτίωση των Μοντέλων Αναγνώρισης Ομιλίας

Σε μια συζήτηση με το TechCrunch τον περασμένο μήνα, ο CEO Mati Staniszewski μίλησε για τη βελτίωση των μοντέλων ανίχνευσης ομιλίας. «Θέλουμε να κατανοούμε καλύτερα τι λέγεται σε μια συνομιλία. Εργαζόμαστε για να μετακινηθούμε πέρα από τη δημιουργία περιεχομένου και να κατανοούμε και να μεταγράφουμε ομιλία», δήλωσε ο Staniszewski. «Πολλοί λένε ότι η αναγνώριση ομιλίας είναι ένα λυμένο πρόβλημα. Αλλά για πολλές γλώσσες, είναι αρκετά κακή. Πιστεύουμε ότι μπορούμε να κατασκευάσουμε καλύτερα μοντέλα ανίχνευσης ομιλίας επειδή έχουμε ομάδες εντός της εταιρείας που σχολιάζουν δεδομένα και μας παρέχουν γρήγορη ανατροφοδότηση.»

Καινοτόμα Χαρακτηριστικά και Μελλοντικές Προοπτικές

Το μοντέλο περιλαμβάνει επίσης έξυπνη διαχωρισμό ομιλητών για να αναγνωρίζει ποιος μιλάει, χρονικές σφραγίδες σε επίπεδο λέξης για ακριβείς υπότιτλους, και αυτόματη ετικετοποίηση ηχητικών γεγονότων όπως γέλια κοινού. Η εταιρεία παρέχει έναν τρόπο για τους πελάτες να μεταγράφουν απευθείας περιεχόμενο βίντεο για να προσθέσουν υπότιτλους ή λεζάντες στο στούντιο της. Το Scribe λειτουργεί επί του παρόντος μόνο με προ-ηχογραφημένες μορφές ήχου. Η εταιρεία δήλωσε ότι σύντομα θα κυκλοφορήσει μια έκδοση του μοντέλου με χαμηλή καθυστέρηση σε πραγματικό χρόνο, που σημαίνει ότι δεν είναι ακόμη αποτελεσματικό για μεταγραφές συναντήσεων ή σημειώσεις φωνής.

Ανταγωνιστική Τιμολόγηση και Σύγκριση με Ανταγωνιστές

Η ElevenLabs τιμολογεί το Scribe στα 0,40 δολάρια για μία ώρα μεταγραμμένου ήχου. Αν και η τιμή είναι ανταγωνιστική, μερικοί από τους ανταγωνιστές της προσφέρουν χαμηλότερη τιμή για μεταγραφές ήχου αυτή τη στιγμή, με κάποιες διαφοροποιήσεις χαρακτηριστικών.

Συμπέρασμα: Η Εξέλιξη της Αναγνώρισης Ομιλίας από την ElevenLabs

Η ElevenLabs κάνει ένα σημαντικό βήμα προς την κατεύθυνση της αναγνώρισης ομιλίας με το νέο της μοντέλο Scribe. Με την υποστήριξη πολλών γλωσσών και καινοτόμα χαρακτηριστικά, η εταιρεία στοχεύει να επαναπροσδιορίσει την αγορά και να προσφέρει βελτιωμένες λύσεις για την αναγνώριση ομιλίας. Ανυπομονούμε να δούμε πώς θα εξελιχθεί αυτή η τεχνολογία και ποιες νέες δυνατότητες θα φέρει στο μέλλον.

Tags: AI NewsAI Tools

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Το Bob της IBM βάζει κανόνες στην AI ανάπτυξη κώδικα.
Νέα

IBM Bob: AI πλατφόρμα για ασφαλέστερη ανάπτυξη λογισμικού

by Theodoros Kostogiannis
29 Απριλίου, 2026
Η Lightelligence, η πρώτη εταιρεία photonics chips από την ηπειρωτική Κίνα που εισήχθη στο χρηματιστήριο του Χονγκ Κονγκ, είδε την τιμή της μετοχής της να εκτοξεύεται σχεδόν 400% στο χρηματιστηριακό της ντεμπούτο.
Νέα

Η Lightelligence ποντάρει στη φωτονική για την AI

by Theodoros Kostogiannis
29 Απριλίου, 2026
Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας
Για Εξειδικευμένες Εφαρμογές

Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας

by Kyriakos Koutsourelis
29 Απριλίου, 2026
Engineering the World: Το συνέδριο που φέρνει το AI από τη θεωρία στη βιομηχανία
Νέα

Engineering the World: Το συνέδριο που φέρνει το AI από τη θεωρία στη βιομηχανία

by Kyriakos Koutsourelis
28 Απριλίου, 2026
Οι κρυφές εντολές στο web απειλούν εταιρικά AI agents.
Νέα

Google: Κακόβουλες ιστοσελίδες παγιδεύουν AI agents

by Theodoros Kostogiannis
28 Απριλίου, 2026
Merck και Google Cloud επενδύουν 1 δισ. δολάρια στην Agentic AI
Εφαρμογές AI

Merck και Google Cloud επενδύουν 1 δισ. δολάρια στην Agentic AI

by Kyriakos Koutsourelis
28 Απριλίου, 2026
Claude Mythos και Κυβερνοασφάλεια: Η Τεχνητή Νοημοσύνη Περνά σε Νέα Εποχή
Για Εξειδικευμένες Εφαρμογές

Claude Mythos και Κυβερνοασφάλεια: Η Τεχνητή Νοημοσύνη Περνά σε Νέα Εποχή

by Kyriakos Koutsourelis
27 Απριλίου, 2026
ISACA: Ανεπαρκής έλεγχος στα εταιρικά συστήματα AI.
Νέα

Κενά στη διαχείριση κινδύνων από συστήματα AI

by Theodoros Kostogiannis
26 Απριλίου, 2026
Το Snowflake ενισχύει Intelligence και Cortex Code.
Νέα

Snowflake: Νέες AI πλατφόρμες για επιχειρήσεις και developers

by Theodoros Kostogiannis
25 Απριλίου, 2026
Next Post
Η Κίνα προωθεί την τεχνητή νοημοσύνη στη διακυβέρνηση

Η Κίνα προωθεί την τεχνητή νοημοσύνη στη διακυβέρνηση

Το Penn State και η IBM αναπτύσσουν AI βοηθό για φοιτητές

Το Penn State και η IBM αναπτύσσουν AI βοηθό για φοιτητές

Η Anthropic παρείχε μια πιο λεπτομερή ματιά στις πολύπλοκες εσωτερικές λειτουργίες του προηγμένου γλωσσικού της μοντέλου, Claude. Το έργο αυτό αποσκοπεί στην απομυθοποίηση του τρόπου με τον οποίο αυτά τα εξελιγμένα συστήματα τεχνητής νοημοσύνης επεξεργάζονται πληροφορίες, μαθαίνουν στρατηγικές και τελικά παράγουν κείμενο που μοιάζει με ανθρώπινο κείμενο.

Το Anthropic παρέχει πληροφορίες για τη «AI biology» του Claude

Πρόσφατα Άρθρα

Το Bob της IBM βάζει κανόνες στην AI ανάπτυξη κώδικα.

IBM Bob: AI πλατφόρμα για ασφαλέστερη ανάπτυξη λογισμικού

29 Απριλίου, 2026
Η Lightelligence, η πρώτη εταιρεία photonics chips από την ηπειρωτική Κίνα που εισήχθη στο χρηματιστήριο του Χονγκ Κονγκ, είδε την τιμή της μετοχής της να εκτοξεύεται σχεδόν 400% στο χρηματιστηριακό της ντεμπούτο.

Η Lightelligence ποντάρει στη φωτονική για την AI

29 Απριλίου, 2026
Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας

Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας

29 Απριλίου, 2026

Ετικέτες

Adobe AI Agents AI News AI Tools AI στην καθημερινότητα Alexa Alibaba Amazon AMD Anthropic Apple AWS Azure AI Chatbot ChatGPT Claude Copilot Deepmind DeepSeek Gemini GenAI Google Grok IBM Intel Llama Meta Microsoft Mistral Moltbook Nvidia OpenAI Oracle Perplexity Physical AI Salesforce Samsung SAP xAI Εκπαίδευση Επιχειρήσεις Ευρωπαϊκή Ένωση Ηνωμένες Πολιτείες Αμερικής Μέσα Κοινωνικής Δικτύωσης Υγεία

Μενού

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
  • Σχετικά με εμάς
  • Βασικές έννοιες
  • Όροι Χρήσης
  • Ιδιωτικότητα

© 2024 Gain - Greek AI Network, all rights reserved.

No Result
View All Result
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI

© 2024 Gain - Greek AI Network, all rights reserved.