El problema que nadie quiere formular en serio

Hay una pregunta que los científicos de sistemas complejos evitan formular con precisión porque formularla bien casi garantiza que no la puedes responder: ¿cómo sé si lo que ocurre en el nivel macro es realmente causado por las interacciones del nivel micro, o si simplemente coinciden?

Es fácil decir que el tráfico emerge de miles de conductores individuales. Es mucho más difícil demostrar que el modelo que captura esas interacciones predice el tráfico mejor que una ecuación diferencial que ni siquiera los mira. Y si no lo demuestra, ¿qué tan real es la "emergencia" que afirmamos?

Ese es el núcleo de este proyecto: no un conjunto de simulaciones lindas, sino un intento de forzar a los sistemas complejos a pasar una prueba.

Hiperobjetos: la filosofía detrás del nombre

El término "hiperobjeto" proviene de Timothy Morton: objetos tan masivamente distribuidos en el tiempo y el espacio que ningún observador puede percibirlos desde afuera. El cambio climático es un hiperobjeto. También lo es el mercado financiero global, o la distribución de plasticos en los océanos. No son abstracciones: son entidades reales que actúan sobre el mundo, pero cuya totalidad nunca está presente en ningún punto de observación.

Simular hiperobjetos requiere, por tanto, al menos dos niveles de descripción que se retroalimentan: los agentes locales que los componen (micro) y las variables de campo que emergen de su agregación y, a su vez, los modulan (macro). Separar esas dos capas y medir cuánto una necesita a la otra — eso es lo que hace este repositorio de manera sistemática.

La arquitectura: ABM acoplado a ODE

Cada uno de los 21 casos del repositorio tiene la misma estructura de dos modelos que corren en paralelo sobre el mismo fenómeno:

Un ABM (Modelo Basado en Agentes) que simula entidades discretas sobre una grilla — conductores, moléculas de contaminante, usuarios de Wikipedia, agentes que forman opiniones — y que recibe un forcing desde el nivel macro.

Un ODE (Ecuación Diferencial Ordinaria) que describe la dinámica del mismo fenómeno en términos continuos y agregados, sin ver a los agentes individuales.

Los dos modelos compiten: ¿cuál predice mejor la serie observada? Pero la competencia no es el punto final; es el instrumento de medición. Lo que interesa es el EDI, el Índice de Dependencia Efectiva.

EDI: una métrica para la interdependencia

El EDI mide algo preciso: cuánto mejora el modelo completo (ABM acoplado al macro) respecto a un modelo reducido que corre sin ese acoplamiento.

EDI = (RMSE_reducido - RMSE_completo) / RMSE_reducido

Si el EDI es cercano a cero, el acoplamiento macro-micro no aporta nada — las dos escalas son independientes y la "emergencia" era una historia. Si supera 0.30, hay dependencia efectiva detectable. Si supera 0.90, el código levanta una bandera de sospecha: probablemente hay tautología, el modelo completo está sobreajustado.

El EDI no es solo un número. Se calcula con intervalos de confianza por bootstrap, se contrasta con surrogates que destruyen la estructura causal, y entra como uno de cinco criterios (C1 a C5): convergencia, robustez paramétrica, replicabilidad con semillas distintas, validez cruzada y no-trivialidad estadística.

Además de EDI, el framework mide Symploké — qué tanto la cohesión interna del sistema supera su dependencia del forcing externo — y no-localidad: si ningún agente individual domina la dinámica global (umbral: menos del 5% del grid).

Los resultados reales: 6 de 21 pasan

De los 21 casos ejecutados, 6 pasan todos los criterios, 14 fallan y 1 queda en estado indeterminado. Eso no es un fracaso del proyecto. Es exactamente lo que debe ocurrir cuando la metodología tiene dientes.

Los casos que pasan — paradigmas, postverdad, urbanización, finanzas, clima, falsación de no-estacionariedad, entre otros — muestran EDI sintético entre 0.64 y 0.91. El caso de paradigmas científicos alcanza 0.837 en sintético y 0.656 en datos reales. El de finanzas logra 0.643 en sintético y 0.880 en real, una de las pocas instancias donde los datos reales son más estructurados que los sintéticos.

Los casos que fallan revelan tanto como los que pasan. El caso de conciencia tiene EDI negativo en ambas modalidades: el modelo acoplado predice peor que el reducido. No porque la conciencia no sea emergente en el sentido filosófico, sino porque ese emergente no es capturable con ABM+ODE sobre los proxies disponibles. El modelo dice: no lo puedo ver desde aquí. Eso es información.

El caso de epidemiología, paradigmático en la literatura SEIR, apenas alcanza EDI=0.007 en sintético. El ODE es suficiente; la emergencia, en este contexto, no supera el ruido.

Lo que enseña el diseño

El patrón más interesante del repositorio no es ningún resultado específico: es la arquitectura del validador unificado. Cada caso implementa solo dos funciones — simulate_abm y simulate_ode — y el pipeline de validación hace el resto. Ningún criterio está hardcodeado; todos se computan desde los datos.

Eso es una decisión filosófica, no solo de ingeniería. Si cada caso pudiera tunear sus propios umbrales de aprobación, el sistema sería un generador de narrativas sobre emergencia, no un detector. La uniformidad del criterio es lo que permite comparar. El diseño impone honestidad.

La existencia de casos de falsación explícita — caso_falsacion_exogeneidad, caso_falsacion_no_estacionariedad, caso_falsacion_observabilidad — refuerza esto. No son casos que el modelo espera ganar. Son casos diseñados para que el modelo falle de maneras conocidas, verificando que el framework detecta exactamente los problemas que debería detectar. Es una forma de validar el validador.

La pregunta que queda abierta

Hay algo incómodo en trabajar con emergencia como objeto de estudio formal. La emergencia se define usualmente como propiedad que no puede reducirse a sus partes. Pero medir cuánto mejora un modelo acoplado sobre uno desacoplado es precisamente un intento de reducción cuantitativa: de convertir la irreducibilidad en un número.

EDI > 0.30 no prueba emergencia en el sentido fuerte que interesa al filósofo. Prueba que la escala macro tiene poder predictivo incremental sobre el micro. Eso es necesario para emergencia causal, pero no suficiente.

Lo que sí prueba este proyecto es otra cosa, más modesta y más útil: que podemos construir marcos de comparación rigurosos para sistemas que habitualmente se describen con retórica. Que 14 de 21 casos fallen la prueba no invalida la empresa — la valida. Y que la brecha entre EDI sintético y EDI real revela algo verdadero sobre la distancia entre los modelos que construimos y los fenómenos que habitamos.

Simular hiperobjetos no es comprenderlos. Pero medir con precisión lo que no entendemos es, a veces, el único punto de partida honesto.