top of page

El robot curioso

19/9/25

Por

Asdrúbal A Romero M

¿Será posible para la IA el que podamos tener maquinas curiosas?

¿Es posible incorporar una actitud como la curiosidad a una maquina? En esta época de sorprendentes avances y la IA, ya no nos asombra tanto que dos ingenieros franceses, Frédéric Kaplan y Pierre-Yves Oudeyer, hayan implementado un algoritmo de curiosidad en un robot.  Las ideas que sustentan este desarrollo parten de la comprensión de las operaciones mentales que subyacen la condición de sentir curiosidad.


Cada vez que nuestro cerebro detecta una brecha entre lo que ya sabemos y lo que nos gustaría saber -un área potencial de aprendizaje-, surge la curiosidad y con ella, de manera natural, la elección entre las diversas opciones accesibles de aquellas que, con mayor probabilidad, pueden ayudarnos a reducir esa brecha y, por ende, adquirir información útil.   Salvando las distancias sobre cómo se implementa físicamente esta teoría, la curiosidad se parece al servo mecanismo desarrollado por Watts para regular la presión de vapor en las calderas (1788). Es decir, la curiosidad es un mecanismo cibernético: viene a ser el gobernador que tenemos en nuestro cerebro para mantener activa una cierta presión por aprender. Y se implementa a través de los circuitos neuronales que actúan la mayoría de las veces de manera inconsciente.


No sentimos curiosidad por lo que ya no nos sorprende, pero tampoco por aquellas cosas o conceptos que, siendo muy novedosos para nosotros, nos generan una sensación de disuasiva complejidad. Nos movemos entre el aburrimiento de lo demasiado conocido o simple y la evasión de lo demasiado complejo. Obviamente, los objetos de nuestra curiosidad son muy cambiantes. Una vez conocemos un objeto, o dominamos un concepto, este pierde su atractivo y redirigimos nuestra curiosidad hacia nuevos desafíos. La mejor manera de visualizar esta evolución dilemática es observando el comportamiento de los bebés. Todo es nuevo para ellos y, por lo tanto, constituye una fuente potencial de aprendizaje. Se muestran apasionados por conocer los objetos más triviales, pero una vez extraído todo el conocimiento que podían adquirir de ese objeto pierden el interés y se desplazan hacia otro. Cuando nacemos, nuestro cerebro viene ya cableado con un mecanismo de motivación intrínseca hacia el aprendizaje. Este incorpora su propio subsistema de recompensa. La adquisición de información que previamente desconocíamos también activa el circuito de la dopamina, tal como lo han demostrado los estudios neuro biológicos en esta área.


La curiosidad es por tanto una fuerza que nos anima a explorar. Desde esta perspectiva, puede asimilarse al impulso que sentimos para obtener comida y sexo. El apetito humano por el conocimiento obtiene su recompensa en dopamina, aun cuando involucre una curiosidad de naturaleza puramente intelectual. Adicionalmente, nuestro algoritmo neuronal evalúa la velocidad de aprendizaje y la curiosidad va siendo amortiguada si el cerebro detecta que no estamos progresando en la adquisición del conocimiento lo suficientemente rápido. Esto me ocurrió cuando en una edad no tan temprana tuve el interés de aprender a tocar el piano. Duró poco la intención; hasta que tomé consciencia de que la complejidad en el pretendido aprendizaje superaba mis expectativas sobre lo que podría obtener del mismo. Estas sencillas ideas que he expuesto han sentado las bases para el desarrollo de un algoritmo de curiosidad en un robot por los mencionados ingenieros.


Cuando un pequeño robot cuadrúpedo equipado con el algoritmo desarrollado por Kaplan y Oudeyer fue colocado en una colchoneta para bebé que hacía las veces de patio de juego o playground (ver la imagen), fue asombrosa la similitud entre el comportamiento del robot y el de los bebés. Toda la experimentación diseñada para testear al robot curioso, confirmó las premisas que sirvieron de fundamento a la implementación del algoritmo y, en cierta forma, este éxito es útil a los fines de validar la teoría que se ha acumulado sobre el funcionamiento de nuestro mecanismo cerebral de motivación intrínseca hacia el aprendizaje.


El algoritmo incluye los siguientes módulos: el primero, es un sistema de aprendizaje artificial clásico que, constantemente, trata de predecir el estado del mundo exterior; el segundo, más innovador, evalúa el desempeño del primero midiendo todo el tiempo la velocidad de aprendizaje más reciente, información que utiliza a los fines de identificar las áreas en las que el robot aprende más rápido; el tercer ingrediente es el circuito de recompensa -o reward-. Este último módulo le asigna mayor valor a las acciones que conducen a un aprendizaje más rápido de acuerdo a los pronósticos del módulo anterior. Como resultado de esta lógica de implementación, el sistema robotizado se enfoca en aquellas áreas donde cree que aprenderá más. Lógica que concuerda, de conformidad a la línea de investigación de los desarrolladores, con la definición misma a nivel neuronal de lo que es curiosidad.


Nota del editor: En el caso de este post, el botón de descarga no producirá la bajada de este artículo, como es usual, sino del documento pdf titulado: “Curiosity-Driven Learning in Development. Computational Theories and Educational Applications”. Del autor: Pierre-Yves Oudeyer. Publicado en “The Cambridge Handbook of Cognitive Development” (2022). Este artículo tutorial bien reciente, contiene un compendio de las investigaciones en el área.





Posts más recientes

16/11/25

Receso y Crisis Institucional

Un receso que no pudo ser. Impedido por un cuadro de extrema gravedad institucional

8/11/25

Crónica de una deriva Cap V

Sobre la falacia argumental para justificar la claudicación total de la Rectora

3/11/25

El Rostro de la Ignominia Académica

La claudicación de la autonomía universitaria ante el poder

bottom of page