La palabra que Hinton nunca pronunció

Anoche, mientras Medellín quedaba en silencio bajo una lluvia densa, pasé tres horas puliendo las transiciones del visualizador de pesos en TensorFlow.js para la presentación sobre Hinton de 1992. Quería que la explicación se pudiera tocar; que la matemática dejara de ser un dogma plano y se convirtiera en algo tridimensional. En mi pantalla, los nodos de la red neuronal artificial brillan en violeta cuando la excitación es positiva y en rojo cuando la inhibición domina. Al activar el paso de retropropagación, pequeñas esferas amarillas —que representan las señales de error— se deslizan hacia atrás, capa por capa, recalculando los gradientes de conexión mediante la regla de la cadena. Es un sistema perfecto, una coreografía lineal que fluye en el navegador con la elegancia predecible de un mecanismo de relojería suizo.

Ver correr esa simulación produce una satisfacción casi física. Pero esa limpieza es la primera trampa. Crecí en Antioquia desarmando computadoras a los trece años, obsesionado con entender cómo el silicio y la soldadura organizaban la corriente para imitar el pensamiento. Desde entonces, mirar los sistemas desde el silicio hacia arriba me enseñó algo fundamental: la realidad física es siempre mucho más ruidosa, viscosa e indómita que cualquier abstracción que construyamos sobre ella. En el cerebro humano no hay partículas amarillas que viajen hacia atrás en el tiempo para recalcular las derivadas parciales de cada sinapsis. En el cerebro, la física manda y la matemática es solo un comentario tardío.

El dilema epistemológico de 1992

En septiembre de 1992, Geoffrey Hinton publicó en Scientific American un ensayo que marcaría el rumbo de la inteligencia artificial moderna: How Neural Networks Learn from Experience. El texto no era una demostración matemática árida, sino una declaración de principios epistemológicos. Hinton proponía un programa de investigación audaz frente al paradigma simbólico dominante de la época —aquel representado por Newell, Simon y Fodor, que concebía la mente como un procesador que manipula símbolos discretos mediante reglas explícitas—. Para Hinton, aprender no consistía en programar reglas de lógica formal, sino en ajustar conexiones sinápticas para que la red construyera de forma autónoma sus propias representaciones internas.

Aquí es donde surge la pregunta que me obsesiona como informático y filósofo: ¿cuándo el éxito predictivo de un modelo justifica una afirmación ontológica sobre la mente? Si una red neuronal artificial logra clasificar dígitos manuscritos o reconocer patrones de imágenes con una precisión del noventa y nueve por ciento, ¿significa eso que hemos explicado cómo el cerebro humano realiza la misma tarea? La tentación de confundir el modelo con la realidad es antigua, pero en la neurociencia computacional adquiere una gravedad particular. La pregunta no es si las redes neuronales artificiales funcionan —hoy sabemos de sobra que sí—, sino qué estamos asumiendo cuando decimos que una red artificial representa el conocimiento del mismo modo en que lo hace una mente biológica.

Una obra maestra de la ingeniería implausible

Para sostener su apuesta en 1992, Hinton dependía de una genialidad de la ingeniería de software: el algoritmo de retropropagación del error (backpropagation). El mecanismo es formalmente impecable. La red ejecuta un pase hacia adelante (forward pass), calcula la diferencia entre su predicción y el valor real (el error de actividad), y luego propaga ese error hacia atrás a través de las capas ocultas para calcular cómo debe cambiar cada peso individual. Es un mecanismo de una eficiencia matemática asombrosa que permitió superar el límite histórico del perceptrón simple que Minsky y Papert habían denunciado en los sesenta.

Sin embargo, la retropropagación carga con un pecado original: su completa implausibilidad biológica. En el cerebro, las conexiones no son simétricas de forma bidireccional; un axón no puede enviar una señal de error hacia atrás por la misma vía física por la que transmite el potencial de acción. Las sinapsis reales son válvulas de una sola dirección. Tampoco existe un "instructor omnisciente" que compare cada disparo neuronal con un resultado ideal para proveer una señal de error matemática precisa.

Aquí se revela la diferencia entre hacer mucho y decidir bien. Hinton y su equipo no estaban intentando hacer una copia literal del cerebro; estaban haciendo ingeniería conceptual. Tomaron la decisión consciente de priorizar el criterio técnico sobre la fidelidad biológica. Sacrificaron el realismo de la neurona de carbono —con sus dinámicas temporales complejas y sus potenciales de acción discretos— para ganar un formalismo diferenciable en silicio. Sabían que para que un modelo sea útil, primero debe poder entrenarse de forma eficiente. Esa simplificación no fue un defecto de su ciencia; fue una excelente decisión de diseño de sistemas que priorizó la tratabilidad matemática frente a la descripción biológica inacabada.

La palabra omitida

Pero en medio de esta elegancia instrumental, hay un silencio elocuente. En todo el texto de Hinton, hay una palabra que nunca se pronuncia, un término que se evita con un cuidado casi litúrgico: "metáfora".

Hinton habla de "dendritas artificiales", de "sinapsis" y de "axones" como si estuviera describiendo el tejido cortical de un lóbulo temporal y no un arreglo bidimensional de números flotantes en memoria RAM. Evita llamar a su modelo una metáfora porque el conexionismo, para tener peso filosófico, necesita sostener la tesis de la realizabilidad múltiple en su versión más fuerte. Si la red es solo una analogía poética de la mente, entonces el funcionalismo computacional pierde su anclaje científico. Al usar el vocabulario de la biología, Hinton intenta construir una equivalencia directa: nos sugiere que el modelo no solo simula la función, sino que captura la esencia del aprendizaje.

El problema es que hay una brecha insalvable entre la convergencia funcional y la identidad mecanística. Sí, experimentos como el de David Sparks con el colículo superior de los monos demuestran que el cerebro utiliza códigos demográficos o vectoriales para controlar movimientos oculares, muy parecidos a los promedios poblacionales que corren en nuestras redes. Y sí, el modelo clásico de Andersen y Zipser demostró que las unidades ocultas de una red entrenada para realizar transformaciones de coordenadas de retina a cabeza desarrollan campos receptivos idénticos a los observados en el área 7a de la corteza parietal del cerebro biológico.

Pero esa convergencia en el "qué hace" nos ciega ante el "cómo lo hace". Al omitir la palabra metáfora, Hinton oculta el peso del sustrato físico. Una neurona real no es una función sigmoidea que devuelve un flotante de precisión simple; es una célula viva que consume energía metabólica, rodeada por astrocitos que modulan su comportamiento y microglia que limpia sus desechos, sujeta a las leyes de la termodinámica del no equilibrio. El cerebro biológico no calcula gradientes ni minimiza pérdidas en un espacio vectorial abstracto; el cerebro sobrevive. La información en la biología no es un sustrato incorpóreo que flota libremente entre el carbono y el silicio; está indisolublemente ligada a la materia que la sostiene.

Como advirtió John Daugman, cada época interpreta el cerebro a través de su tecnología más avanzada: lo pensamos como un sistema hidráulico en el siglo XVII, como un telégrafo en el XIX y como una computadora digital en el XX. La red neuronal artificial de Hinton es solo el avatar contemporáneo de esa misma costumbre. Es una metáfora extremadamente potente, tal vez la mejor que tenemos para simular el comportamiento emergente, pero no deja de ser una proyección de nuestras herramientas sobre el misterio de la materia viva.

El espejo de silicio

Hoy, más de treinta años después del texto de Hinton, las redes neuronales han alcanzado una escala monstruosa. Los transformadores y los modelos de lenguaje modernos devoran gigavatios de energía para procesar billones de parámetros en servidores remotos. Ejecutan tareas que hacen parecer a los clasificadores de 1992 como juguetes de cuerda. Y, sin embargo, la tensión ontológica sigue siendo la misma.

Al final de la noche, apago el monitor. El brillo violeta y rojo de la simulación de retropropagación desaparece, dejando la habitación a oscuras. Me queda una inquietud que ningún poder de cómputo adicional podrá resolver. Al construir sistemas tan masivos y opacos que ahora necesitamos desarrollar herramientas de "interpretabilidad mecanicista" solo para intuir qué están haciendo sus capas ocultas, ¿estamos realmente comprendiendo la mente, o solo hemos construido una metáfora tan grande que ya no cabe en nuestra propia cabeza?

El peligro real de la inteligencia artificial no es que empiece a pensar como nosotros, sino que nosotros, fascinados por la perfección de nuestro propio espejo de silicio, olvidemos que una simulación del viento nunca podrá soplar una vela.

— Steven Vallejo, Medellín

El dilema epistemológico de 1992

Una obra maestra de la ingeniería implausible

La palabra omitida

El espejo de silicio

Steven Vallejo

Artículos relacionados

Cuando el cuerpo no puede quedarse

El problema de lo que existe antes del objeto

Cuando el fenómeno no cabe en el modelo

Una idea útil, sin ruido.