Nvidia quiere prender la mecha de la robótica humanoide: "No es ciencia ficción"
A finales de marzo, una escritora polaca escribió este tuit sobre la inteligencia artificial: “¿Sabes qué es lo malo de todo esto de empujar todo lo relacionado con la inteligencia artificial? Que va en la dirección equivocada. Quiero que la IA me haga la colada y lave los platos para que yo pueda crear arte y escribir, no que haga arte y escriba para que yo pueda hacer la colada y lavar los platos”.
La reflexión de Joanna Maciejewska, que pelea por hacerse un hueco en la escena de la literatura fantástica, se convirtió en una de las más compartidas en casi cualquier debate sobre la inteligencia artificial. Consigue conectar con esa sensación de que esta revolución tecnológica no ha ido por donde muchos esperaban. En tres años han aparecido sistemas que escriben como literatos, que componen canciones, diseñan videojuegos, producen guiones y crean todo tipo de arte. Pero no hay robots que se encarguen de limpiar el baño ni los tan anticipados coches que se conduzcan solos.
“Hay un motivo por el que los robots están haciendo arte y no tareas domésticas”, explica Juan G. Victores, profesor titular e investigador del RoboticsLab de la Universidad Carlos III de Madrid. “Al hacer arte no se está rompiendo nada. Te puedes equivocar. Es un campo en el que puedes introducir IA y permitirte que haya cosas que salgan mal. Sin embargo un robot que lava platos con un 99% de eficiencia sería un desastre, rompería algo en uno de cada 100 pasos. Para las tareas domésticas necesitas un 100% de eficacia, algo lejano con los modelos que tenemos ahora mismo”, explica en entrevista con elDiario.es.
Pero que haya inteligencias artificiales que creando arte y no cambiando bombillas no significa que esa parte de la robótica no esté avanzando. Solo que lo hace de puertas adentro del laboratorio. Y es precisamente Nvidia, la empresa cuyos chips han hecho posible la revolución creativa de los algoritmos, la que ahora quiere dar el mismo empujón a las máquinas para que sus habilidades manuales se acerquen a las de los humanos.
“Construir modelos básicos para robots humanoides es uno de los problemas en el campo de la IA más interesantes que aún no han sido resueltos hoy en día”, dijo su fundador y director ejecutivo, Jensen Huang, en la conferencia de desarrolladores anual de la empresa de este año. “La próxima generación de robótica probablemente será la robótica humanoide. Ahora disponemos de la tecnología necesaria para imaginar una robótica humanoide generalizada”, afirmó con su clásica chaqueta de cuero rodeado de nueve androides que se están desarrollando por diferentes empresas gracias a su tecnología.
El avance presentado por Nvidia es un “gimnasio” para que los programadores puedan probar las capacidades de sus robots. Un espacio generado gracias a sus avanzados chips de IA para que los robots puedan entrenar en un mundo virtual de manera similar a como lo hacen los algoritmos generativos que crean textos, imágenes o música.
“Uno de los mayores problemas del entrenamiento de robots es que si este entrenamiento es con RL [aprendizaje por refuerzo, por sus siglas en inglés] requiere miles y miles de experimentos, y esto es costosísimo en tiempo”, expone Julián Estévez, profesor de Inteligencia Artificial y Robótica de la Universidad del País Vasco.
Esto es lo que Huang propone solucionar gracias a su nuevo simulador. Su objetivo es que su entorno virtual de entrenamiento sirva tanto para que las empresas no especializadas en robótica puedan desarrollar robots en los espacios donde van a emplearlos (como tiendas, calles de una ciudad o cadenas de montaje) así como para que startups con pocos recursos puedan probar sus ideas sin hacer miles de experimentos con modelos físicos. Un ejemplo de estas últimas es Figure 01, en la que han invertido tanto la propia Nvidia como OpenAI.
“No es nuevo como técnica, solamente aspira a que la programación y la reprogramación de robots para nuevas tareas sea más fácil, con menos código, sino que los robots vayan imitando a los humanos para aprender a hacer cosas”, continúa Estévez: “Nvidia está intentando que su sistema sea ligero, de menor coste computacional que otros modelos, y más asequible”.
¿La hora de los robots?
Los alardes promocionales futuristas se han convertido en la norma de la industria de la IA, especialmente por parte de startups que buscan las milmillonarias inversiones que el capital riesgo y los gigantes digitales está inyectando en el sector desde la irrupción de ChatGPT. Pero Huang no es un recién llegado al sector ni Nvidia está construida sobre promesas, sino sobre la venta de unos chips extremadamente avanzados con respecto a los de su competencia.
Fundada en 1993, la compañía se especializó en producir tecnología más potente y eficiente para la visualización de los videojuegos, las llamadas unidades de procesamiento gráfico (GPU). Fue una gran desconocida para el gran público durante más de dos décadas. Hasta que se comprobó que las mismas GPU que estaban impulsando el rendimiento gráfico de los videojuegos también eran extremadamente adecuadas para las tareas de cálculo paralelo intensivo que requieren muchos algoritmos de IA y sus sistemas de aprendizaje automático.
Ignacio Montesino, también investigador en el RoboticsLab de la UC3M, resume el impacto de Nvidia en su trabajo. “En mi caso pasar a entrenar con el simulador de Nvidia supuso hacerlo 20 veces más rápido. Es una locura, porque no solo implica que puedo entrenar más rápido sino que antes, entre que yo tenía una idea y podía ver el resultado pasaban de esa idea 20 horas. Básicamente un día entero. Ahora pasa una hora. Mi capacidad de inventar es mucho más rápida”.
Muchos analistas ya empiezan a hablar de burbuja en el campo de la IA, pero con Nvidia la cuenta es más sencilla. El potencial económico de ChatGPT es aún desconocido, pero sin Nvidia no existiría el actual ChatGPT. España está desarrollando el proyecto Alia, un ChatGPT entrenado en castellano y lenguas cooficiales, gracias al supercomputador MareNostrum 5, cuya joya de la corona son los chips de Nvidia. Igual que en los nuevos siete centros de datos que Amazon construirá en Aragón invirtiendo 15.700 millones.
Cada uno de esos movimientos impacta en la cuenta de resultados de Nvidia, que en su último trimestre presentó unos beneficios que multiplican por siete lo que ganó en el mismo período del año anterior. De 2.043 a 14.881 millones de dólares. Su cotización en bolsa se ha multiplicado por ocho desde que apareció ChatGPT.
Por eso, cuando Huang volvió a recalcar en el congreso de digitalización de Taiwán, la meca de los chips, que el próximo gran objetivo de su empresa es impulsar los robots humanoides, el mundo tecnológico escucha. “La próxima ola de IA es la IA física. Una IA que entienda las leyes de la física. IA que puede trabajar entre nosotros”, dijo. Serán “modelos que pueden entender instrucciones y realizar de forma autónoma tareas complejas en el mundo real”.
“Esto no es ciencia ficción”, enfatizaba el empresario, nacido en Taiwán pero que creció en EEUU. Su empresa, que llegó a ser la más valiosa del mundo en junio superando a Apple y Microsoft, sería sin duda la más beneficiada de ese avance. “En estos últimos 60 años, hemos visto dos o tres cambios que lo modificaron todo en el mundo de la tecnología. Está pasando eso ahora mismo”.
Qué les falta para llegar
elDiario.es ha preguntado a varios especialistas en robótica por las palabras de Huang. “Nvidia tiene un incentivo claro para decir estas cocas. Pero también creo que su empuje es real porque ellos no tendrían ninguna necesidad de meterse en robótica ahora mismo sino fuera porque quieren. Huang ha sabido ver las cosas muy claras muchas veces”, expone Ignacio Montesino.
Tanto él como Victores opinan que el sector está en punto de inflexión. Sin embargo, no creen que los robots humanoides estén a la vuelta de la esquina. “Normalmente hemos ido viendo mejoras incrementales, pequeños avances que nos permitían pronosticar dónde estaríamos en cinco o diez años. Ahora la situación es diferente, estamos en un momento de mucha incertidumbre. Necesitamos uno o dos años para ver mejor la altura del techo”, pide Victores.
Los dos investigadores revelan en su conversación con este medio que los modelos de IA actuales tienen una serie de fallas que les hacen incompatibles con la robótica humanoide. Estos modelos conocidos como transformers, son un tipo de arquitectura de red neuronal introducido en 2017 y la base de los desarrollos actuales (como el Transformer Generativo Pre-entrenado, las siglas en inglés de la tecnología detrás de ChatGPT).
Al tener dificultades para extrapolar, les cuesta adaptarse a nuevas situaciones. Por eso todavía necesitar entornos muy controlados
Sin embargo adolecen de dos problemas principales para ser la mente de esos robots de la ciencia ficción, detallan. “Por un lado la eficiencia, ya que necesitan un gran volumen de muestras, necesitan muchísimos datos para mejorar”, expone Victores. “El segundo es que son algoritmos de aproximación que funcionan bien para interpolar, pero extrapolan fatal. Un ejemplo sencillo es que si tu le preguntas a un robot cuál es el punto de arriba a la izquierda en un plano cuadrado, no se va a la esquina superior izquierda, sino que te lo pone en un punto intermedio entre el lado izquierdo y el superior. Es decir, hace una media gaussiana”, continúa.
Esto provoca que “les cueste adaptarse a nuevas situaciones. Por eso todavía necesitar entornos muy controlados, espacios específicos y diseños muy concretos”. Si bien algunos campos de la robótica han avanzado mucho en los últimos, como la visión por ordenador (que ambos especialistas dan prácticamente como “un problema resuelto”) las trabas que describen son lo que provoca que aún sea muy complicado para los robots operar libremente en un espacio en el que también hay personas.
Es el motivo que hace que el androide que desarrolla Tesla al mandado de Elon Musk esté más lejos de poder doblar la ropa en un entorno real de lo que parece por sus habilidades demostradas en el laboratorio.
Ese próximo avance podría llegar de cualquier parte. “Tenemos todo lo que hace falta, pero nos falta esa chispa, ese nuevo modelo, ese nuevo enfoque que nos sirva como peldaño y consiga hacer avanzar la bola de nieve. Puede que ni siquiera llegue del campo de la robótica, o que ni siquiera sean redes neuronales. Sabemos que seguramente los transformers no nos valgan, pero tenemos las condiciones perfectas”, afirma Montesino.
¿Por qué humanoides?
Además del cuándo, la apuesta de Huang también ha reabierto el debate sobre la forma de los robots. El empresario taiwanés-estadounidense defiende que el futuro de la robótica pasa porque las máquinas se parezcan a los humanos. Pero muchos especialistas creen que esto será mucho más caro y no tiene por qué ser más práctico.
“No está tan claro que la masificación de los robots requiera que estos tengan morfología de humanoide”, declara Julián Estévez, de la Universidad del País Vasco, ni “que hallemos su principal nicho de valor añadido siendo manipuladores”. “Puede que los robots sean más útiles con ruedas o con patas”, incide.
“El empeño de hacerlos humanoides responde a que el mundo está hecho para humanos, pero puede que eso no sea lo óptimo en este equilibrio entre costes, valor añadido, habilidades técnicas y negocio”, desarrolla Estévez.
El empeño de hacerlos humanoides responde a que el mundo está hecho para humanos, pero puede que eso no sea lo óptimo en este equilibrio entre costes, valor añadido, habilidades técnicas y negocio
Para el CEO de Nvidia la clave es el entrenamiento. Como ha ocurrido con la IA generativa, este tipo de androides no solo podrían usar datos del comportamiento de otros con su misma forma (con ruedas, brazos robóticos, etc.) sino que podrían utilizar la información que generamos los humanos. “Los robots humanoides son los más fáciles de adaptar al mundo, porque nosotros construimos el mundo para nosotros. También disponemos de más datos para entrenar a estos robots que a otros tipos de robots porque tenemos el mismo físico que ellos”, afirma Huang.
Un debate que sucede mientras la conversación sobre qué ocurrirá si la inteligencia artificial empieza a sustituir a las personas en el mundo laboral no está ni mucho menos resuelta. Nvidia, al igual que el resto de multinacionales de la industria de la IA, considera sus avances beneficiarán a toda la humanidad, pero también dibuja un incierto escenario para todos aquellos cuyas ocupaciones podrían ser reemplazadas por máquinas. La promesa de un futuro donde los robots hagan la colada y laven los platos, permitiendo a los humanos enfocarse en otras actividades, se enfrenta a la realidad de un posible desplazamiento masivo de empleos y menos oportunidades para las personas arrolladas por él.