Εισαγωγή
Οι εργασίες Deep Learning και Τεχνητής Νοημοσύνης συνεχίζουν να απαιτούν υψηλότερη απόδοση και χαμηλότερη κατανάλωση ενέργειας. Αυτό το τεχνικό άρθρο παρουσιάζει τον επόμενης γενιάς επιταχυντή AI από την Intel και την Habana Labs, μια εταιρεία της Intel: τον επιταχυντή Intel® Gaudi® 3 AI. Ο νέος επιταχυντής διαθέτει την 5η γενιά ετερογενούς αρχιτεκτονικής επιτάχυνσης AI. Ο επιταχυντής Intel® Gaudi® 3 έχει σχεδιαστεί για να παρέχει κορυφαία απόδοση στο κέντρο δεδομένων για όλες τις εργασίες AI, από γεννητικές εφαρμογές όπως μεγάλα γλωσσικά μοντέλα (LLMs) και μοντέλα διάχυσης (δημιουργία εικόνων όπως το Stable Diffusion) έως την αναγνώριση αντικειμένων, την ταξινόμηση και τη μεταγλώττιση φωνής.
Βελτιώσεις Απόδοσης του Intel® Gaudi® 3 AI
Ο επιταχυντής Intel® Gaudi® 3 AI, που κατασκευάζεται με τη διαδικασία 5nm της TSMC, προσφέρει βελτιωμένη πυκνότητα περιοχής και ενεργειακή απόδοση σε σύγκριση με τον προκάτοχό του, τον Intel® Gaudi® 2 AI επιταχυντή, ο οποίος κατασκευάζεται με τη διαδικασία 7nm. Ο νέος επιταχυντής συνεχίζει να ωθεί τα όρια της απόδοσης και της ενεργειακής απόδοσης. Χτισμένος πάνω στην αρχιτεκτονική του Intel® Gaudi® 2, ο επιταχυντής Intel® Gaudi® 3 προσφέρει σημαντικές αυξήσεις στην υπολογιστική ισχύ, το εύρος ζώνης μνήμης και την αρχιτεκτονική αποδοτικότητα.
Ο επιταχυντής Intel® Gaudi® 3 διαθέτει δύο υπολογιστικές μήτρες, οι οποίες περιλαμβάνουν συνολικά 8 κινητήρες MME, 64 κινητήρες TPC και 24 θύρες RDMA NIC των 200 Gbps. Επιπλέον, τα 8 τσιπ HBM2e σχηματίζουν μια ενιαία μνήμη υψηλού εύρους ζώνης (HBM) των 128 GB. Ο επιταχυντής Intel® Gaudi® 3 είναι εξαιρετικός στην εκπαίδευση και την πρόβλεψη με 1.8 PFlops υπολογιστικής ισχύος FP8 και BF16, 128 GB μνήμης HBM2e και 3.7 TB/s εύρους ζώνης HBM.
Απόδοση Εκπαίδευσης και Πρόβλεψης
Οι εφαρμογές AI απαιτούν ολοένα και ταχύτερες και πιο ενεργειακά αποδοτικές λύσεις υλικού και ο επιταχυντής Intel® Gaudi® 3 έχει σχεδιαστεί για να ανταποκρίνεται σε αυτήν την ανάγκη. Με περισσότερα από 2x FP8 GEMM FLOPs και περισσότερα από 4x BF16 GEMM FLOPs σε σύγκριση με τον επιταχυντή Intel® Gaudi® 2, ο επιταχυντής Intel® Gaudi® 3 συνεχίζει να παρέχει κορυφαία απόδοση εκπαίδευσης AI. Με 1.5x ταχύτερο εύρος ζώνης HBM και 1.33x μεγαλύτερη χωρητικότητα HBM, ο επιταχυντής Intel® Gaudi® 3 προσφέρει βελτίωση κατά μια τάξη μεγέθους στην απόδοση πρόβλεψης μεγάλων γλωσσικών μοντέλων σε σύγκριση με τον επιταχυντή Intel® Gaudi® 2.
Σύγκριση με τον NVIDIA H100
Ο επιταχυντής Intel® Gaudi® 3 έχει σχεδιαστεί για να προσφέρει ανταγωνιστική απόδοση σε βασικές εργασίες AI, καθώς και ελκυστική σχέση τιμής-απόδοσης σε σύγκριση με τον NVIDIA H100. Οι μεγάλες χωρητικότητες και το εύρος ζώνης HBM επιτρέπουν στον επιταχυντή Intel® Gaudi® 3 να επιτυγχάνει κορυφαία απόδοση στην εκπαίδευση και την πρόβλεψη AI.
Συμπέρασμα
Ο επιταχυντής Intel® Gaudi® 3 AI αποτελεί ένα σημαντικό βήμα προς τα εμπρός στην απόδοση και την ενεργειακή αποδοτικότητα για τις εργασίες AI. Με σημαντικές βελτιώσεις στην υπολογιστική ισχύ, το εύρος ζώνης μνήμης και την αρχιτεκτονική αποδοτικότητα, ο επιταχυντής αυτός είναι έτοιμος να ανταποκριθεί στις αυξανόμενες απαιτήσεις των εφαρμογών AI. Για περισσότερες πληροφορίες σχετικά με τον επιταχυντή Intel® Gaudi® 3 AI και πώς μπορεί να βελτιώσει τις επιδόσεις των εφαρμογών σας, επισκεφθείτε την ιστοσελίδα της Intel.