Αρχιτεκτονική για επεκτάσιμους AI agents

Πώς ο διαχωρισμός λογικής και αναζήτησης ενισχύει την κλιμάκωση των πρακτόρων AI

Η απομόνωση της λογικής από την εκτέλεση βελτιώνει την κλιμάκωση των πρακτόρων AI, αποσυνδέοντας τις βασικές ροές εργασίας από τις στρατηγικές εκτέλεσης. Η μετάβαση από πρωτότυπα γενετικής AI σε πράκτορες παραγωγής εισάγει ένα συγκεκριμένο μηχανικό εμπόδιο: την αξιοπιστία. Τα μεγάλα γλωσσικά μοντέλα (LLMs) είναι από τη φύση τους στοχαστικά. Ένα ερώτημα που λειτουργεί μία φορά μπορεί να αποτύχει στη δεύτερη προσπάθεια. Για να αντιμετωπιστεί αυτό, οι ομάδες ανάπτυξης συχνά ενσωματώνουν την κύρια επιχειρηματική λογική σε πολύπλοκους βρόχους διαχείρισης σφαλμάτων, επαναλήψεις και διακλαδώσεις. Αυτή η προσέγγιση δημιουργεί πρόβλημα συντήρησης. Ο κώδικας που ορίζει τι πρέπει να κάνει ένας πράκτορας γίνεται αδιάσπαστα συνδεδεμένος με τον κώδικα που ορίζει πώς να χειριστεί την απρόβλεπτη φύση του μοντέλου.

Προτεινόμενο νέο πρότυπο αρχιτεκτονικής για την κλιμάκωση των πρακτόρων

Μια νέα πλατφόρμα που προτείνεται από ερευνητές από το Asari AI, το MIT CSAIL και το Caltech προτείνει ένα διαφορετικό αρχιτεκτονικό πρότυπο για την κλιμάκωση των ροών εργασίας πρακτόρων στην επιχείρηση. Η έρευνα εισάγει ένα μοντέλο προγραμματισμού που ονομάζεται Πιθανολογικός Αγγελικός Μη Προσδιορισμός (Probabilistic Angelic Nondeterminism – PAN) και μια υλοποίηση σε Python με την ονομασία ENCOMPASS. Αυτή η μέθοδος επιτρέπει στους προγραμματιστές να γράφουν τη “χαρούμενη διαδρομή” της ροής εργασίας ενός πράκτορα, ενώ μεταθέτει τις στρατηγικές εκτέλεσης (π.χ. αναζήτηση δέσμης ή επαναφορά) σε μια ξεχωριστή μηχανή χρόνου εκτέλεσης. Αυτή η διαχωριστική ανησυχία προσφέρει μια πιθανή διαδρομή για τη μείωση του τεχνικού χρέους, ενώ βελτιώνει την απόδοση των αυτοματοποιημένων εργασιών.

Το πρόβλημα της σύμπλεξης στο σχεδιασμό πρακτόρων

Οι τρέχουσες προσεγγίσεις στον προγραμματισμό πρακτόρων συχνά συγχέουν δύο διαφορετικές πτυχές σχεδιασμού. Η πρώτη είναι η βασική λογική ροής εργασίας, ή η ακολουθία των βημάτων που απαιτούνται για την ολοκλήρωση μιας επιχειρηματικής εργασίας. Η δεύτερη είναι η στρατηγική χρόνου εκτέλεσης, η οποία καθορίζει πώς το σύστημα πλοηγείται στην αβεβαιότητα, όπως η δημιουργία πολλαπλών προσχεδίων ή η επαλήθευση των εξόδων έναντι ενός κανόνα. Όταν αυτές οι πτυχές συνδυάζονται, η προκύπτουσα βάση κώδικα γίνεται εύθραυστη. Η εφαρμογή μιας στρατηγικής όπως η “καλύτερη από Ν” δειγματοληψία απαιτεί την ενσωμάτωση ολόκληρης της λειτουργίας του πράκτορα σε έναν βρόχο. Η μετάβαση σε μια πιο σύνθετη στρατηγική, όπως η αναζήτηση δέντρου ή η βελτίωση, συνήθως απαιτεί πλήρη αναδιάρθρωση του κώδικα του πράκτορα.

Αποσύνδεση λογικής από την αναζήτηση για την ενίσχυση της κλιμάκωσης των πρακτόρων AI

Το πλαίσιο ENCOMPASS αντιμετωπίζει αυτό το ζήτημα επιτρέποντας στους προγραμματιστές να επισημαίνουν “τοποθεσίες μη αξιοπιστίας” μέσα στον κώδικά τους χρησιμοποιώντας ένα πρωτόγονο που ονομάζεται branchpoint(). Αυτοί οι δείκτες υποδεικνύουν πού συμβαίνει μια κλήση LLM και πού μπορεί να αποκλίνει η εκτέλεση. Ο προγραμματιστής γράφει τον κώδικα σαν να πρόκειται η λειτουργία να επιτύχει. Κατά την εκτέλεση, το πλαίσιο ερμηνεύει αυτά τα σημεία διακλάδωσης για να κατασκευάσει ένα δέντρο αναζήτησης πιθανών διαδρομών εκτέλεσης. Αυτή η αρχιτεκτονική επιτρέπει στους συγγραφείς να δημιουργούν πράκτορες “προγράμματος-σε-έλεγχο”. Σε αντίθεση με τα συστήματα “LLM-σε-έλεγχο”, όπου το μοντέλο αποφασίζει ολόκληρη τη σειρά των λειτουργιών, οι πράκτορες προγράμματος-σε-έλεγχο λειτουργούν μέσα σε μια ροή εργασίας που καθορίζεται από τον κώδικα. Το LLM καλείται μόνο για την εκτέλεση συγκεκριμένων υποεργασιών. Αυτή η δομή προτιμάται γενικά σε επιχειρηματικά περιβάλλοντα για την υψηλότερη προβλεψιμότητα και δυνατότητα ελέγχου σε σύγκριση με πλήρως αυτόνομους πράκτορες.

Επίδραση στη μετανάστευση κώδικα και τη μετάφραση

Η χρησιμότητα αυτής της προσέγγισης είναι εμφανής σε σύνθετες ροές εργασίας όπως η μετανάστευση παλαιού κώδικα. Οι ερευνητές εφάρμοσαν το πλαίσιο σε έναν πράκτορα μετάφρασης από Java σε Python. Η ροή εργασίας περιλάμβανε τη μετάφραση ενός αποθετηρίου αρχείο προς αρχείο, τη δημιουργία εισόδων και την επαλήθευση της εξόδου μέσω εκτέλεσης. Σε μια τυπική υλοποίηση Python, η προσθήκη λογικής αναζήτησης σε αυτή τη ροή εργασίας απαιτούσε τον ορισμό μιας μηχανής κατάστασης. Αυτή η διαδικασία συσκότιζε την επιχειρηματική λογική και έκανε τον κώδικα δύσκολο να διαβαστεί ή να ελεγχθεί. Η εφαρμογή αναζήτησης δέσμης απαιτούσε από τον προγραμματιστή να διασπάσει τη ροή εργασίας σε μεμονωμένα βήματα και να διαχειριστεί ρητά την κατάσταση σε ένα λεξικό μεταβλητών.

Συμπεράσματα και επιπτώσεις για την κλιμάκωση πρακτόρων AI

Ο διαχωρισμός της λογικής από τη στρατηγική αναζήτησης επιτρέπει την ανεξάρτητη βελτιστοποίηση και των δύο. Αυτή η διαχωριστική ανησυχία διευκολύνει επίσης την καλύτερη διακυβέρνηση. Αν μια συγκεκριμένη στρατηγική αναζήτησης αποφέρει ψευδαισθήσεις ή σφάλματα, μπορεί να προσαρμοστεί παγκοσμίως χωρίς να αξιολογηθεί κάθε μεμονωμένη βάση κώδικα του πράκτορα. Απλοποιεί την έκδοση των συμπεριφορών AI, μια απαίτηση για ρυθμιζόμενες βιομηχανίες όπου το “πώς” μιας απόφασης είναι εξίσου σημαντικό με το αποτέλεσμα. Η έρευνα υποδεικνύει ότι καθώς η υπολογιστική ισχύς του χρόνου εκτέλεσης αυξάνεται, η πολυπλοκότητα της διαχείρισης των διαδρομών εκτέλεσης θα αυξηθεί. Οι αρχιτεκτονικές επιχειρήσεων που απομονώνουν αυτή την πολυπλοκότητα θα αποδειχθούν πιθανώς πιο ανθεκτικές από αυτές που επιτρέπουν να διαπεράσει το επίπεδο εφαρμογής.