AD

Η Google λανσάρει τσιπ TPU 8 με 3 φορές μεγαλύτερη ισχύ για επιτάχυνση της τεχνητής νοημοσύνης και μείωση του κόστους (Interesting Engineering)

tags :
Η Google λανσάρει τσιπ TPU 8 με 3 φορές μεγαλύτερη ισχύ για επιτάχυνση της τεχνητής νοημοσύνης και μείωση του κόστους (Interesting Engineering)
Σύμφωνα με την Google, η TPU 8i προσφέρει 80% καλύτερη απόδοση ανά δολάριο από την προηγούμενη γενιά, επιτρέποντας στους πελάτες να χειρίζονται σχεδόν διπλάσιο φόρτο εργασίας με το ίδιο κόστος

Η Google παρουσίασε τις Μονάδες Επεξεργασίας Tensor όγδοης γενιάς, εισάγοντας δύο προσαρμοσμένα τσιπ τεχνητής νοημοσύνης (AI) σχεδιασμένα ξεχωριστά για εκπαίδευση μοντέλων και εξαγωγή συμπερασμάτων, καθώς η ζήτηση για μεγάλης κλίμακας υπολογιστική τεχνητή νοημοσύνη αυξάνεται.

Οι νέοι επεξεργαστές

Οι νέοι επεξεργαστές, που ανακοινώθηκαν στο Google Cloud Next, ονομάζονται TPU 8t και TPU 8i. Είναι κατασκευασμένοι για να τροφοδοτούν την πλατφόρμα υπερυπολογιστών τεχνητής νοημοσύνης της Google και να υποστηρίζουν φόρτο εργασίας που κυμαίνονται από την εκπαίδευση μοντέλων αιχμής έως την εξυπηρέτηση πρακτόρων τεχνητής νοημοσύνης στην παραγωγή.

Οι TPU είναι οι εσωτερικοί επιταχυντές της Google που τροφοδοτούν εσωτερικά συστήματα όπως το Gemini εδώ και χρόνια. Η εταιρεία επεκτείνει τώρα αυτό το υλικό σε πελάτες που αναζητούν εναλλακτικές λύσεις στην υποδομή τεχνητής νοημοσύνης που κυριαρχείται από την Nvidia.

Η Google δήλωσε ότι και τα δύο τσιπ θα γίνουν γενικά διαθέσιμα αργότερα φέτος.

Δύο τσιπ εμφανίζονται

Το TPU 8t είναι βελτιστοποιημένο για την εκπαίδευση μεγάλων μοντέλων τεχνητής νοημοσύνης. Η Google δήλωσε ότι ένα μόνο superpod μπορεί να κλιμακωθεί σε 9.600 τσιπ και να προσφέρει 121 exaflops υπολογιστικής απόδοσης.

Η εταιρεία πρόσθεσε ότι το TPU 8t προσφέρει σχεδόν τριπλάσια υπολογιστική απόδοση ανά pod σε σύγκριση με την προηγούμενη γενιά, Ironwood. Τα συστήματα εκπαίδευσης έλαβαν επίσης ταχύτερη πρόσβαση σε αποθηκευτικό χώρο και αναβαθμισμένη δικτύωση με στόχο να διατηρούν τα τσιπ απασχολημένα αντί να περιμένουν δεδομένα.

Η Google δήλωσε ότι το TPU 8t στοχεύει σε περισσότερο από 97% «καλή απόδοση», έναν όρο που χρησιμοποιείται για τη μέτρηση του παραγωγικού χρόνου υπολογισμού αντί του χρόνου αδράνειας που προκαλείται από βλάβες ή σημεία συμφόρησης.

Αυτό έχει σημασία επειδή οι καθυστερήσεις σε τεράστια clusters μπορούν να προσθέσουν ημέρες στα προγράμματα εκπαίδευσης για προηγμένα συστήματα AI. Το TPU 8i εστιάζει στην εξαγωγή συμπερασμάτων, το στάδιο όπου τα εκπαιδευμένα μοντέλα AI απαντούν σε προτροπές, εκτελούν εργαλεία και τροφοδοτούν πράκτορες λογισμικού.

Ώθηση στην εποχή των πρακτόρων

Η Google δήλωσε ότι το TPU 8i περιλαμβάνει 288 GB μνήμης υψηλού εύρους ζώνης και 384 MB SRAM ενσωματωμένης μνήμης, βοηθώντας στη διατήρηση των ενεργών δεδομένων του μοντέλου πιο κοντά στον επεξεργαστή για ταχύτερες απαντήσεις.

Το τσιπ χρησιμοποιεί επίσης CPU που βασίζονται σε Axion Arm της Google και αναβαθμισμένο εύρος ζώνης διασύνδεσης για μοντέλα Mixture of Experts ή MoE. Αυτές οι αρχιτεκτονικές ενεργοποιούν μόνο μέρη ενός μοντέλου κάθε φορά για να μειώσουν το κόστος, ενώ παράλληλα κλιμακώνουν την απόδοση.

Τι προσφέρει η κυκλοφορία

Σύμφωνα με την Google, η TPU 8i προσφέρει 80% καλύτερη απόδοση ανά δολάριο από την προηγούμενη γενιά, επιτρέποντας στους πελάτες να χειρίζονται σχεδόν διπλάσιο φόρτο εργασίας με το ίδιο κόστος.

Η κυκλοφορία υπογραμμίζει τον τρόπο με τον οποίο η υποδομή AI μετατοπίζεται πέρα ​​από τις GPU γενικής χρήσης προς εξειδικευμένα τσιπ που έχουν ρυθμιστεί για διαφορετικά φόρτα εργασίας.

Η Google δήλωσε ότι η στρατηγική των δύο τσιπ διαμορφώθηκε από την άνοδο των πρακτόρων AI, οι οποίοι χρειάζονται συστήματα που μπορούν να συλλογίζονται μέσω εργασιών, να εκτελούν ροές εργασίας και να αλληλεπιδρούν επανειλημμένα με εργαλεία και άλλα μοντέλα.

Στα κέντρα δεδομένων, η Google δήλωσε ότι και τα δύο τσιπ προσφέρουν επίσης έως και δύο φορές καλύτερη απόδοση ανά watt από την Ironwood. Χρησιμοποιούν υγρή ψύξη τέταρτης γενιάς για να υποστηρίξουν υψηλότερη πυκνότητα υπολογισμού, ελέγχοντας παράλληλα την κατανάλωση ενέργειας.

Η ανακοίνωση υπογραμμίζει επίσης την ευρύτερη προσπάθεια της Google να αμφισβητήσει την κυριαρχία της Nvidia στο υλικό AI συνδυάζοντας προσαρμοσμένο πυρίτιο, δικτύωση, πλαίσια λογισμικού και υπηρεσίες cloud σε μία στοίβα.

www.worldenergynews.gr

Ρoή Ειδήσεων

Δείτε επίσης