El jefe de IA de Meta afirma que los modelos del mundo son clave para la ‘IA a nivel humano’, pero podría tardar 10 años

Publicado el 16 de octubre de 2024 por Maxwell Zeff

¿Los modelos de IA actuales realmente recuerdan, piensan, planean y razonan, como lo haría un cerebro humano? Algunos laboratorios de IA te harían creer que así es, pero según el principal científico de IA de Meta, Yann LeCun, la respuesta es no. Sin embargo, él cree que podríamos llegar allí en una década si seguimos un nuevo método llamado “modelo del mundo”.

Desmitificando la IA actual

Este año, OpenAI lanzó una nueva función denominada “memoria” que permite a ChatGPT “recordar” tus conversaciones. La última generación de modelos de OpenAI muestra la palabra “pensando” mientras genera una salida, y la empresa afirma que estos modelos son capaces de “razonamiento complejo”. Todo esto suena como si estuviéramos muy cerca de la Inteligencia Artificial General (AGI). Sin embargo, durante una reciente charla en el Hudson Forum, LeCun contradijo a los optimistas de la IA, como el fundador de xAI, Elon Musk, y el cofundador de Google DeepMind, Shane Legg, quienes sugieren que la IA a nivel humano está a la vuelta de la esquina.

“Necesitamos máquinas que entiendan el mundo; que puedan recordar cosas, tener intuición, sentido común, y que puedan razonar y planear al mismo nivel que los humanos”, dijo LeCun durante la charla. “A pesar de lo que hayas escuchado de algunas de las personas más entusiastas, los sistemas de IA actuales no son capaces de nada de esto.”

La visión de Yann LeCun sobre modelos del mundo

LeCun sostiene que los modelos de lenguaje grandes (LLMs), como los que impulsan ChatGPT y Meta AI, están muy lejos de ser IA a nivel humano. La humanidad podría estar “años o décadas” de lograr tal cosa. La razón es sencilla: estos LLMs trabajan prediciendo el siguiente token (usualmente unas pocas letras o una palabra corta), mientras que los modelos de imagen/video actuales están prediciendo el siguiente píxel. Es decir, los modelos de lenguaje son predictores unidimensionales, y los modelos de imagen/video son bidimensionales. Estos modelos se han vuelto bastante buenos para predecir dentro de sus respectivas dimensiones, pero en realidad no entienden el mundo tridimensional.

A causa de esto, los sistemas de IA modernos no pueden realizar tareas simples que la mayoría de los humanos pueden. LeCun señala que los humanos aprenden a limpiar una mesa de cena a los 10 años y a conducir un automóvil a los 17, y aprenden ambas cosas en unas pocas horas. Sin embargo, incluso los sistemas de IA más avanzados hoy en día, que se basan en miles o millones de horas de datos, no pueden operar de manera confiable en el mundo físico.

El potencial de los modelos del mundo

Para lograr tareas más complejas, LeCun sugiere que necesitamos construir modelos tridimensionales que puedan percibir el mundo que los rodea, y que giren en torno a un nuevo tipo de arquitectura de IA: los modelos del mundo. “Un modelo del mundo es tu modelo mental de cómo se comporta el mundo”, explicó. “Puedes imaginar una secuencia de acciones que podrías llevar a cabo, y tu modelo del mundo te permitirá predecir el efecto de esa secuencia de acciones sobre el mundo.”

Considera el “modelo del mundo” en tu propia cabeza. Por ejemplo, imagina mirar un dormitorio desordenado y querer limpiarlo. Puedes imaginar cómo recoger toda la ropa y guardarla solucionaría el problema. No necesitas probar múltiples métodos ni aprender cómo limpiar una habitación primero. Tu cerebro observa el espacio tridimensional y crea un plan de acción para lograr tu objetivo a la primera. Ese plan de acción es el secreto que los modelos del mundo de IA prometen.

Una parte del beneficio aquí es que los modelos del mundo pueden incorporar significativamente más datos que los LLMs. Sin embargo, también son intensivos en cálculos, razón por la cual los proveedores de la nube están compitiendo para asociarse con empresas de IA.

Los modelos del mundo son la gran idea que varios laboratorios de IA están persiguiendo, y el término se convierte rápidamente en la próxima palabra de moda para atraer financiamiento de riesgo. Un grupo de investigadores de IA muy respetados, incluidas Fei-Fei Li y Justin Johnson, recientemente recaudó 230 millones de dólares para su startup, World Labs. La “madrina de la IA” y su equipo también están convencidos de que los modelos del mundo desbloquearán sistemas de IA significativamente más inteligentes. OpenAI también describe su generador de video no liberado, Sora, como un modelo del mundo, aunque no ha entrado en detalles.

Un futuro incierto

LeCun describió una idea para usar modelos del mundo para crear IA a nivel humano en un documento de 2022 sobre “IA orientada a objetivos”, aunque él señala que el concepto tiene más de 60 años. En resumen, una representación base del mundo (como el video de una habitación sucia, por ejemplo) y la memoria son alimentadas a un modelo del mundo. Luego, el modelo predice cómo será el mundo basado en esa información. Posteriormente, se le dan al modelo objetivos, incluyendo un estado alterado del mundo que te gustaría alcanzar (como una habitación limpia), así como barreras para asegurar que el modelo no haga daño a los humanos al alcanzar un objetivo (no me mates en el proceso de limpiar mi habitación, por favor). Entonces, el modelo del mundo encuentra una secuencia de acciones para lograr estos objetivos.

El laboratorio de investigación de IA a largo plazo de Meta, FAIR (Investigación Fundamental de IA), está trabajando activamente en la construcción de IA orientada a objetivos y modelos del mundo, según LeCun. FAIR solía trabajar en IA para los próximos productos de Meta, pero LeCun dice que el laboratorio ha cambiado en los últimos años para centrarse puramente en la investigación de IA a largo plazo. LeCun afirma que FAIR ni siquiera utiliza LLMs actualmente.

Los modelos del mundo son una idea intrigante, pero LeCun dice que no hemos avanzado mucho en llevar estos sistemas a la realidad. Hay muchos problemas muy difíciles para avanzar desde donde estamos hoy, y dice que es ciertamente más complicado de lo que pensamos. “Tomará años antes de que podamos hacer que todo esto funcione, si no es una década”, dijo LeCun. “Mark Zuckerberg sigue preguntándome cuánto va a tardar.”

Conclusión

La búsqueda por una IA a nivel humano parece más lejana según Yann LeCun, quien destaca la necesidad de un enfoque radicalmente diferente a través de modelos del mundo. Aunque estas innovaciones son prometedoras, el conocimiento actual y la tecnología no pueden replicar de forma efectiva las capacidades cognitivas humanas. A medida que continuamos investigando y desarrollando, será interesante seguir el progreso de estos modelos y ver si realmente pueden cerrar la brecha hacia una inteligencia artificial verdaderamente humana.

Preguntas para la Audiencia

  • ¿Qué opinas sobre la afirmación de que la IA está lejos de alcanzar un nivel humano?
  • ¿Crees que los modelos del mundo pueden revolucionar el desarrollo de la IA?
  • ¿Qué otros enfoques te parecen prometedores para alcanzar la inteligencia artificial general?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *