Durante medio siglo, las investigaciones sobre la inteligencia artificial (IA) se basaron en una extraña analogía con la lógica. El razonamiento lógico consiste en utilizar reglas de inferencia válidas para deducir conclusiones verdaderas a partir de premisas ciertas. Tanto las premisas como las conclusiones son concatenaciones de símbolos y las reglas de inferencia son meros mecanismos de manipulación de estas concatenaciones. Los investigadores dieron por sentado que esta era la manera en la que debía funcionar toda la inteligencia.
Desde los albores de la IA existieron apóstatas que afirmaban que, en vez de imitar a la lógica, la IA debía tratar de imitar las redes neuronales del cerebro. En estas redes, los estímulos generan grandes patrones de actividad neuronal. Estos a su vez producen otros grandes patrones de actividad neuronal que acaban originando respuestas motoras. Todo el conocimiento del sistema reside en la manera en que un patrón de actividad da lugar a otro, y este conocimiento se aprende a través de la experiencia más que a través de los datos introducidos por un programador.
En los últimos años, ha quedado patente que conseguir que un ordenador simule ser una red neuronal es una forma muy eficaz de dotar a las máquinas de la clase de inteligencia que se necesita para tareas tales como el reconocimiento de voz, la interpretación de imágenes, la traducción automática y la práctica de juegos como el go, que requieren conocimientos intuitivos. Este planteamiento se denomina “aprendizaje profundo” (deep learning) porque utiliza redes neuronales profundas compuestas por muchas capas de neuronas. En lugar de tratar de poner por escrito todo lo que sabemos mediante expresiones simbólicas, permitimos que el ordenador aprenda todo lo que sabe a partir de ejemplos.
Si deseamos traducir una frase del español al coreano, entrenamos a un ordenador mediante la introducción de multitud de pares de frases en español con sus traducciones en coreano hasta que asimile el concepto. El ordenador está programado para comportarse como una red de neuronas cerebrales. Dicha red aprende modificando la intensidad de las conexiones entre las células cerebrales artificiales mediante un algoritmo de uso general bastante sencillo denominado propagación hacia atrás o “retropropagación” (backpropagation). Mediante este algoritmo de aprendizaje, la red neuronal artificial aprende a convertir los símbolos introducidos correspondientes a las palabras en español en patrones de actividad en miles de neuronas que captan los significados de esas palabras. Por ejemplo, la palabra “miércoles” generará un patrón de actividad determinado y la palabra “jueves” dará lugar a un patrón muy similar.
Los “vectores de palabras” internos aportan la información para otro conjunto de neuronas que van acumulando actividad con el transcurso del tiempo. Para cuando la red alcanza el final de la frase española, estas otras neuronas poseen un patrón de actividad llamado “vector de pensamiento” que representa el significado de la frase en su totalidad. Posteriormente, este vector de pensamiento se puede volver a convertir en símbolos del idioma que deseemos, siempre y cuando dispongamos de datos para entrenar a la red neuronal que descodifica el vector de pensamiento. A diferencia de la IA tradicional basada en la lógica, los símbolos solo aparecen en los datos introducidos y en los resultados.
El aprendizaje profundo ya ha revolucionado la capacidad que tienen los equipos informáticos para percibir el mundo y está revolucionando su capacidad para moverse con agilidad y realizar la manipulación de objetos con destreza. Está empezando a posibilitar que los ordenadores comprendan el contenido de los documentos y mantengan conversaciones racionales. Lograr que un ordenador realice una tarea específica mediante su programación ha dejado de ser la única opción. A partir de ahora, cuando una tarea sea tan compleja que no sepamos cómo programarla, podremos indicar al ordenador que simule una red neuronal y entrenar a dicha red para que realice la tarea con solo mostrarle multitud de ejemplos de la información de entrada y de la respuesta deseada.
El aprendizaje profundo tendrá un efecto revolucionario en la asistencia sanitaria. Una red neuronal entrenada con 130.000 ejemplos ya es tan capaz como un dermatólogo de decidir si una lesión cutánea es un cáncer y, de ser así, qué tipo de cáncer es. Cuando haya sido entrenada con millones de ejemplos, será mucho mejor que un dermatólogo. Cualquiera podrá obtener un diagnóstico inmediato, fiable y sumamente barato con solo apuntar su teléfono móvil hacia la mancha cutánea que le preocupa. Otra red neuronal puede examinar una imagen de la retina de una persona diabética y determinar el estadio de retinopatía. Esta práctica será muy valiosa para mejorar la eficacia de los tratamientos en aquellos países que no puedan permitirse contar con un gran número de oftalmólogos. Durante la próxima década, las redes neuronales aprenderán a interpretar la mayoría de los tipos de imágenes médicas de manera mucho más fiable, rápida y asequible que los facultativos. Las redes neuronales también serán mejores que los médicos a la hora de predecir qué tratamientos serán eficaces y de adaptarlos a las particularidades específicas de cada paciente, incluyendo su perfil genético.
La idea tradicional de que la esencia del pensamiento humano consiste en razonar de manera lógica mediante la manipulación de expresiones en una especie de lenguaje simbólico interno está sucumbiendo ante un punto de vista completamente diferente, según el cual un pensamiento es simplemente un gran patrón de actividad neuronal. Podemos hacer referencia a uno de estos patrones haciendo uso de la concatenación de palabras que normalmente lo generaría o de la concatenación de palabras que produciría, pero el pensamiento en sí mismo no tiene nada que ver con una concatenación de palabras. Los pensamientos similares son patrones similares y tienen efectos similares, de modo que el razonamiento por analogía sea la forma básica del pensamiento humano en vez de una desviación ilógica de la racionalidad.
Muchos expertos en este campo creen que los cerebros son tan solo máquinas extraordinariamente complicadas y que, con el tiempo, el aprendizaje profundo podrá hacer lo mismo que puede hacer el cerebro. Pero también creen que esto tardará mucho tiempo en ocurrir y que requerirá muchos más avances técnicos en la tecnología del aprendizaje profundo. En cualquier sistema político que esté dirigido por personas y para personas, el aprendizaje profundo será una potente fuerza positiva para mejorar la salud, eliminar los trabajos más arduos y liberar a la gente corriente para que disfrute de la vida al máximo.
(*) Catedrático de Ciencias de la Computación en la Universidad de Toronto y Vicepresidente e Investigador en Ingeniería de Google.
COMENTARIOS