Η IBM προσφέρει 3 έργα AI ανοιχτού κώδικα στο Linux Foundation

IBM’s Strategic Contribution of Open-Source AI Projects to the Linux Foundation

Η IBM έχει πάρει μια σημαντική απόφαση να συνεισφέρει τρία έργα ανοιχτού κώδικα—Docling, Data Prep Kit και BeeAI—στο Linux Foundation. Αυτή η κίνηση υποδηλώνει όχι μόνο την πιθανή ανάπτυξη αυτών των έργων αλλά και τη συνεχιζόμενη δέσμευση της IBM προς την ανοιχτή τεχνολογία τεχνητής νοημοσύνης. “Συνεχίζουμε την μακρά μας ιστορία συνεισφοράς έργων ανοιχτού κώδικα για να εξασφαλίσουμε ότι είναι εύκολα προσβάσιμα και ότι είναι εύκολο για άλλους—όχι μόνο για εμάς—να συνεισφέρουν,” αναφέρει ο Brad Topol, Διακεκριμένος Μηχανικός και Διευθυντής Ανοιχτών Τεχνολογιών της IBM. Ο Topol επίσης προεδρεύει του Διοικητικού Συμβουλίου του LF AI & Data Foundation, μιας ομάδας που φιλοξενείται υπό το Linux Foundation και επικεντρώνεται στην προώθηση της καινοτομίας ανοιχτού κώδικα στην τεχνητή νοημοσύνη και τις τεχνολογίες δεδομένων. Κάθε έργο επικεντρώνεται σε ένα κρίσιμο μέρος της στοίβας ανάπτυξης AI, και καθώς η βιομηχανία ωριμάζει, η καινοτομία που προέρχεται από την ευρύτερη κοινότητα των προγραμματιστών είναι το κλειδί για να καταστεί η AI έτοιμη για επιχειρήσεις.

Docling: Επαναστατική Μετατροπή Αδόμητων Εγγράφων για AI

Το Docling, το οποίο ξεκίνησε και έγινε ανοιχτού κώδικα πριν από ένα χρόνο, αντιμετωπίζει έναν περιορισμό που έχουν πολλά μοντέλα βάσης για επιχειρηματική χρήση. Ενώ τα μοντέλα έχουν εκπαιδευτεί σε κάθε διαθέσιμη πληροφορία, πολλά από τα δεδομένα που είναι πολύτιμα για τις επιχειρήσεις βρίσκονται σε έγγραφα που δεν είναι προσβάσιμα στο διαδίκτυο: PDF, ετήσιες εκθέσεις, παρουσιάσεις. Το Docling απλοποιεί τη διαδικασία μετατροπής αδόμητων εγγράφων σε αρχεία JSON και Markdown που είναι εύκολα κατανοητά από μεγάλα γλωσσικά μοντέλα (LLMs) και άλλα μοντέλα βάσης. Από την κυκλοφορία του, το Docling έχει κερδίσει δημοτικότητα, συγκεντρώνοντας περισσότερα από 23.000 αστέρια στο GitHub. Όταν συνδυάζεται με τεχνικές ανάκτησης-αυξημένης παραγωγής (RAG), το Docling βελτιώνει τις εξόδους των LLM. “Το Docling μπορεί να κάνει τα LLM να απαντούν πολύ καλύτερα και πιο συγκεκριμένα στις ανάγκες τους,” λέει ο Topol.

Data Prep Kit: Καθαρισμός και Εμπλουτισμός Δεδομένων για AI

Ένα άλλο κρίσιμο βήμα στην ανάπτυξη AI είναι η προετοιμασία δεδομένων. Το Data Prep Kit της IBM, που κυκλοφόρησε το 2024, έχει επίσης κερδίσει δημοτικότητα: βοηθά στον καθαρισμό, τη μετατροπή και τον εμπλουτισμό αδόμητων δεδομένων για περιπτώσεις χρήσης προεκπαίδευσης, λεπτομερούς προσαρμογής και RAG. Τα αδόμητα δεδομένα—όπως βάσεις δεδομένων, ιστοσελίδες και αρχεία ήχου που είναι πιο περίπλοκα για ανάλυση και εξαγωγή πληροφοριών—αποτελούν το 90% όλων των δεδομένων που παράγονται από επιχειρήσεις, σύμφωνα με την IDC. Τα LLM μπορούν να αναλύσουν τεράστιες ποσότητες αδόμητων δεδομένων και να εξάγουν σχετικές πληροφορίες για τη δημιουργία και τη δοκιμή νέων ιδεών προϊόντων ή υπηρεσιών, για παράδειγμα, σε ώρες αντί για μήνες.

BeeAI: Ενίσχυση της Ανάπτυξης και Συνεργασίας AI Πρακτόρων

Καθώς οι πράκτορες AI κερδίζουν έδαφος, η IBM κυκλοφόρησε το BeeAI. Το BeeAI μπορεί να χρησιμοποιηθεί από προγραμματιστές για να ανακαλύψουν, να εκτελέσουν και να συνθέσουν πράκτορες AI από οποιοδήποτε πλαίσιο, συμπεριλαμβανομένων των CrewAI, LangGraph και AutoGen. Το έργο περιλαμβάνει το Πρωτόκολλο Επικοινωνίας Πρακτόρων, που υποστηρίζει την ανακαλυψιμότητα και τη διαλειτουργικότητα των πρακτόρων, και το πλαίσιο BeeAI, το εγγενές του πλαίσιο για την κατασκευή πρακτόρων σε Python ή TypeScript, βελτιστοποιημένο για μοντέλα ανοιχτού κώδικα. “Υπάρχουν άλλα πλαίσια για την κατασκευή πρακτόρων,” λέει ο Topol. “Αλλά το ωραίο με το BeeAI είναι ότι παρέχει μια πλατφόρμα όπου μπορείτε επίσης να συνδέσετε πράκτορες από αυτές τις άλλες τεχνολογίες.”

Συμπέρασμα: Η Δέσμευση της IBM για Ανοιχτή Καινοτομία

Με τη συνεισφορά αυτών των έργων στο Linux Foundation, η IBM στοχεύει να επεκτείνει την εμβέλειά τους και να προσελκύσει νέους συνεισφέροντες και χρήστες. “Τα έργα βρίσκονται σε μια υπέροχη θέση όπου οι άνθρωποι μπορούν να επενδύσουν τους πόρους τους. Κάνει τεράστια διαφορά,” λέει ο Topol. “Είναι σαν μια ασφαλιστική πολιτική. Η ανοιχτή διακυβέρνηση επίσης κάνει τους ανθρώπους να αισθάνονται καλύτερα ότι αν συνεισφέρουν, με την πάροδο του χρόνου, θα κερδίσουν τη θέση τους μέσω αυτού που αποκαλούμε αξιοκρατία και θα κερδίσουν έναν πιο επιδραστικό ρόλο στο έργο. Μπορούν επίσης να αισθάνονται ασφαλείς ότι το έργο δεν θα κάνει καμία δραστική αλλαγή στην άδεια ανοιχτού κώδικα που θα μπορούσε να εμποδίσει δραματικά τη μελλοντική χρήση του έργου.” Σημειώνοντας το Kubernetes—ένα σύστημα ορχήστρωσης κοντέινερ ανοιχτού κώδικα που αρχικά αναπτύχθηκε από την Google και αργότερα δωρίστηκε στο Cloud Native Computing Foundation—ο Topol παρατηρεί πώς η υιοθέτησή του αυξήθηκε μετά την ένταξή του σε ένα μοντέλο ανοιχτής διακυβέρνησης, τελικά το καθιστώντας ένα βιομηχανικό πρότυπο. Έχει τολμηρές φιλοδοξίες για αυτά τα έργα. “Ένα έργο ανοιχτού κώδικα με ένα ισχυρό οικοσύστημα είναι, ειλικρινά, ασταμάτητο,” λέει.