Il modello RT-2 di Google aiuta i robot a eseguire più facilmente azioni in nuove situazioni
Google ha annunciato un nuovo modello di visione-linguaggio-azione (VLA) chiamato Robotics Transformer 2 (RT-2), che descrive come “un primo nel suo genere”. Secondo Google, RT-2 è in grado di accettare input di testo o immagini e produrre azioni robotiche.
La società ha affermato che l’addestramento dei robot può essere uno “sforzo erculeo” perché hanno bisogno di addestramento su miliardi di punti di dati per ogni oggetto, ambiente, attività e situazione nel mondo. Con RT-2, tuttavia, Google afferma che c’è un’enorme promessa per robot più generici.
Sebbene la società sia entusiasta di ciò che RT-2 può sbloccare, ha affermato che è necessario fare molto lavoro per abilitare robot utili in ambienti incentrati sull’uomo. Alla fine, secondo DeepMind , un robot fisico generico potrebbe derivare da modelli VLA e potrebbero ragionare, risolvere problemi e interpretare le informazioni per eseguire attività del mondo reale.
Come suggerisce il nome, questa non è la prima iterazione del modello Robotics Transformer VLA. DeepMind ha affermato che RT-2 si basa sul lavoro di RT-1 e mostra capacità di generalizzazione migliorate rispetto ai modelli precedenti e si comporta meglio su attività nuove e invisibili.
Un’altra nuova abilità di cui RT-2 era capace rispetto ai suoi predecessori è il ragionamento simbolico, il che significa che può comprendere concetti astratti e manipolarli logicamente. Un esempio di ciò è quando al robot è stato chiesto di spostare la bana alla somma di 2 più 1 e ha eseguito correttamente il compito anche se non era stato esplicitamente addestrato a eseguire matematica astratta o manipolazione simbolica.
Sebbene RT-2 sia un importante passo avanti per la robotica, non sarebbe giusto dichiarare che i robot Terminator sono arrivati. Il modello richiede ancora input e supervisione umani e presenta limitazioni tecniche significative nelle operazioni dei robot nel mondo reale.
Detto questo, si spera che porterà ad alcuni robot interessanti in grado di eseguire compiti che prima non erano possibili o facili da eseguire.
Lascia un commento