Google no quiere que la IA se quede en la pantalla: Gemini Robotics es su plan para que los robots actĂșen en el mundo real
La robĂłtica y la inteligencia artificial (IA) van de la mano. De nada servirĂa desarrollar robots humanoides capaces de levantar toneladas, con sensores de Ășltima generaciĂłn, si no contĂĄramos con un sistema inteligente que les permitiera interpretar el entorno y actuar en consecuencia. Sin IA, un robot moderno serĂa poco mĂĄs que un montĂłn de hardware sofisticado pero inĂștil. Son los algoritmos avanzados los que transforman esa potencia bruta en mĂĄquinas capaces de aprender, optimizar su rendimiento y responder de manera autĂłnoma a los desafĂos que se les presentan.
Desde ASIMO, el icĂłnico robot de Honda de los 2000, hasta Sophia, Optimus de Tesla o Figure, la IA ha ido abriĂ©ndose camino en la robĂłtica humanoide. Sin embargo, aĂșn estamos lejos de ver mĂĄquinas que realmente igualen la versatilidad del cuerpo humano. Por mĂĄs avanzados que sean, siguen teniendo problemas para moverse en entornos no controlados y manipular objetos cotidianos puede ser un autĂ©ntico desafĂo.
Estos desafĂos estĂĄn llevando a una nueva generaciĂłn de modelos de IA diseñados especĂficamente para esta disciplina. Google, como era de esperar, no quiere quedarse atrĂĄs y ya trabaja en soluciones que prometen llevar a los robots humanoides un paso mĂĄs allĂĄ. Su apuesta pasa por Gemini 2.0, que ahora tiene dos versiones pensadas para mejorar la interacciĂłn y el control de estas mĂĄquinas.
Por un lado, Gemini Robotics se enfoca en la visiĂłn, el lenguaje y la acciĂłn (VLA), lo que le permite tomar el control directo de los robots y mejorar su capacidad de respuesta en entornos dinĂĄmicos. Por otro, Gemini Robotics-ER estĂĄ pensado para los expertos en robĂłtica, dĂĄndoles las herramientas necesarias para desarrollar y ejecutar sus propios programas con habilidades de razonamiento avanzadas.
Google ha identificado tres cualidades esenciales que, segĂșn explican, deben tener los robots para ser realmente Ăștiles para las personas.
Gemini Robotics no solo destaca en la resoluciĂłn de tareas imprevistas, sino que su capacidad de generalizaciĂłn duplica con creces el rendimiento de otros modelos de visiĂłn-lenguaje-acciĂłn. SegĂșn el informe tĂ©cnico de Google, es capaz de adaptarse a escenarios inĂ©ditos y tomar decisiones sin entrenamiento previo, acercando a los robots a una autonomĂa real.
Ademås, ha sido diseñado para funcionar con distintos tipos de robots. Aunque se entrenó principalmente con ALOHA 2, una plataforma de dos brazos, también ha demostrado controlar sistemas como los brazos Franka, usados en laboratorios, e incluso humanoides mås avanzados como Apolo, desarrollado por Apptronik. Su flexibilidad lo convierte en un modelo adaptable a diversas aplicaciones, desde la industria hasta la asistencia.
Por ahora, no hay una fecha prevista para un despliegue generalizado de Gemini Robotics o Gemini Robotics-ER. La tecnologĂa sigue en desarrollo y, por el momento, solo un grupo reducido de empresas estĂĄ teniendo acceso a estas herramientas.
Google DeepMind estĂĄ colaborando con Apptronik en la construcciĂłn de la prĂłxima generaciĂłn de robots humanoides, explorando cĂłmo integrar estos modelos de IA en sistemas mĂĄs avanzados. AdemĂĄs, algunos testers de confianza, como Agile Robots, Agility Robotics, Boston Dynamics y Enchanted Tools, ya estĂĄn probando Gemini Robotics-ER, aunque no estĂĄ claro si ese acceso se ampliarĂĄ en el futuro.
Mientras tanto, Google DeepMind sigue trabajando en nuevos marcos y benchmarks de seguridad para evaluar los posibles riesgos de la IA en entornos fĂsicos. Todo esto deja claro que, aunque el proyecto avanza, todavĂa queda un largo camino antes de que esta tecnologĂa llegue al gran pĂșblico.
En este blog Frente a una IA que dice sĂ a todo, una preocupaciĂłn: asĂ jamĂĄs lograremos crear un Einstein o un Newton
No hay comentarios.: