AD
Βιομηχανία & Απανθρακοποίηση

Google: Νέα τεχνολογία ΑΙ επιτρέπει στα ρομπότ να κατανοούν, να σχεδιάζουν και να ενεργούν σε πραγματικά περιβάλλοντα (Interesting Engineering)

Google: Νέα τεχνολογία ΑΙ επιτρέπει στα ρομπότ να κατανοούν, να σχεδιάζουν και να ενεργούν σε πραγματικά περιβάλλοντα (Interesting Engineering)
Το μοντέλο, Gemini Robotics-ER 1.6, εστιάζει στην «ενσωματωμένη συλλογιστική», επιτρέποντας στα ρομπότ να ερμηνεύουν οπτικές εισόδους, να σχεδιάζουν εργασίες και να καθορίζουν πότε μια εργασία έχει ολοκληρωθεί

Η Google παρουσίασε ένα νέο μοντέλο Τεχνητής Νοημοσύνης που έχει σχεδιαστεί για να βοηθά τα ρομπότ να κατανοούν και να αλληλεπιδρούν καλύτερα με τον φυσικό κόσμο, αντιμετωπίζοντας μια από τις μεγαλύτερες προκλήσεις στη ρομποτική: τη συλλογιστική πέρα ​​από τις οδηγίες.

Έρχεται μια μετατόπιση

Το μοντέλο, Gemini Robotics-ER 1.6, εστιάζει στην «ενσωματωμένη συλλογιστική», επιτρέποντας στα ρομπότ να ερμηνεύουν οπτικές εισόδους, να σχεδιάζουν εργασίες και να καθορίζουν πότε μια εργασία έχει ολοκληρωθεί. Αυτό σηματοδοτεί μια μετατόπιση από μηχανές που εκτελούν εντολές σε συστήματα ικανά να λαμβάνουν αποφάσεις με επίγνωση του περιβάλλοντος.

Η ενημέρωση βασίζεται σε προηγούμενες εκδόσεις βελτιώνοντας τη χωρική συλλογιστική και την κατανόηση πολλαπλών προβολών, επιτρέποντας στα ρομπότ να επεξεργάζονται πληροφορίες από πολλαπλές τροφοδοσίες κάμερας και δυναμικά περιβάλλοντα πιο αποτελεσματικά.

Εισάγει επίσης νέες δυνατότητες όπως η ανάγνωση οργάνων, επιτρέποντας στα ρομπότ να ερμηνεύουν μετρητές και δείκτες που συναντώνται συνήθως σε βιομηχανικά περιβάλλοντα.

Γεφυρώνοντας το ψηφιακό φυσικό χάσμα

Μια βασική βελτίωση έγκειται στον τρόπο με τον οποίο το μοντέλο χειρίζεται εργασίες χωρικής συλλογιστικής. Το Gemini Robotics-ER 1.6 μπορεί να αναγνωρίζει αντικείμενα, να τα μετράει και να καθορίζει τις σχέσεις μεταξύ τους με μεγαλύτερη ακρίβεια. Μπορεί επίσης να υποδεικνύει αντικείμενα ως μέρος της διαδικασίας συλλογισμού του, βοηθώντας το να αναλύσει σύνθετες εργασίες σε μικρότερα βήματα.

Αυτή η δυνατότητα είναι κρίσιμη σε πραγματικά περιβάλλοντα όπου τα ρομπότ πρέπει να αλληλεπιδρούν με αντικείμενα, να πλοηγούνται σε γεμάτους χώρους και να λαμβάνουν αποφάσεις με βάση ελλιπείς ή μεταβαλλόμενες πληροφορίες.

Το μοντέλο βελτιώνει επίσης την ανίχνευση επιτυχίας, επιτρέποντας στα ρομπότ να αξιολογούν εάν μια εργασία έχει ολοκληρωθεί σωστά. Αυτό είναι ιδιαίτερα σημαντικό στις ροές εργασίας αυτοματισμού, όπου τα συστήματα πρέπει να αποφασίσουν εάν θα επαναλάβουν μια ενέργεια ή θα προχωρήσουν.

Η συλλογιστική πολλαπλών όψεων είναι ένας άλλος τομέας προόδου. Τα ρομπότ συχνά βασίζονται σε πολλαπλές εισόδους κάμερας, όπως όψεις από πάνω και από τον καρπό. Το μοντέλο μπορεί να συνδυάσει αυτές τις προοπτικές για να σχηματίσει μια πιο ολοκληρωμένη κατανόηση του περιβάλλοντος, ακόμη και σε περιπτώσεις απόφραξης ή κακής ορατότητας.

Ανάγνωση σημάτων πραγματικού κόσμου

Μία από τις πιο πρακτικές προσθήκες είναι η δυνατότητα ανάγνωσης οργάνων όπως μανόμετρα, γυαλιά όρασης και ψηφιακές οθόνες. Αυτή η δυνατότητα αναπτύχθηκε σε συνεργασία με την Boston Dynamics, όπου ρομπότ όπως το Spot χρησιμοποιούνται για επιθεωρήσεις εγκαταστάσεων.

«Δυνατότητες όπως η ανάγνωση οργάνων και η πιο αξιόπιστη συλλογιστική εργασιών θα επιτρέψουν στο Spot να βλέπει, να κατανοεί και να αντιδρά σε προκλήσεις του πραγματικού κόσμου εντελώς αυτόνομα», δήλωσε ο Marco da Silva, Αντιπρόεδρος και Γενικός Διευθυντής της Spot στην Boston Dynamics.

Το μοντέλο χρησιμοποιεί έναν συνδυασμό οπτικής συλλογιστικής και εκτέλεσης κώδικα για την ερμηνεία των μετρήσεων. Μπορεί να κάνει ζουμ σε εικόνες, να αναγνωρίσει βασικά στοιχεία όπως βελόνες και σημάνσεις και να υπολογίσει τιμές με υψηλή ακρίβεια.

Νέα σημαντικά κέρδη

Τα benchmarks απόδοσης δείχνουν σημαντικά κέρδη. Η ακρίβεια ανάγνωσης οργάνων βελτιώθηκε από 23% σε προηγούμενα μοντέλα σε έως και 93% με ενεργοποιημένη την όραση agency.

Το μοντέλο δείχνει επίσης καλύτερη συμμόρφωση με τους περιορισμούς ασφαλείας, όπως η αποφυγή μη ασφαλούς χειρισμού αντικειμένων.

Η Google δήλωσε ότι το μοντέλο είναι το ασφαλέστερο ρομποτικό σύστημα μέχρι στιγμής, με βελτιωμένη ικανότητα ανίχνευσης κινδύνων και τήρησης κανόνων φυσικής ασφάλειας τόσο σε σενάρια κειμένου όσο και σε οπτικά σενάρια.

Το Gemini Robotics-ER 1.6 είναι πλέον διαθέσιμο στους προγραμματιστές μέσω του Gemini API και του Google AI Studio, μαζί με εργαλεία για τη δοκιμή και την κατασκευή εφαρμογών χρησιμοποιώντας ενσωματωμένη συλλογιστική.

www.worldenergynews.gr

Ρoή Ειδήσεων

Δείτε επίσης