# El poder que no necesita tu nombre
Dante Avaro
5 de junio de 2026
#op-eds
Hay un silencio en la documentación pública del "Gemelo Digital Social" argentino que dice más que sus anuncios. En ninguna parte, ni en el comunicado del Ministerio de Capital Humano ni en las entrevistas posteriores, aparece la expresión "datos sintéticos". El gobierno prefiere un vocabulario más doméstico: cruzar registros, digitalizar trazabilidad, anticipar situaciones. Aunque no soy afecto a las lecturas conspirativas, debo reconocer que ese silencio admite solamente dos explicaciones, y ninguna es tranquilizadora: o es ignorancia técnica genuina sobre el concepto que el propio proyecto va a necesitar inevitablemente, o es una elusión deliberada de un término que, una vez pronunciado, arrastra consecuencias regulatorias que el ministerio preferiría discutir más tarde —de hecho, la propia hoja de ruta posterga "ética algorítmica y marcos regulatorios" a una cuarta etapa, todavía sin fecha.
Conviene, entonces, hacer el trabajo que el gobierno no hizo: decir con precisión qué es un dato sintético, y por qué la distinción importa más de lo que el debate sobre privacidad —concentrado, hasta ahora, en la anonimización— logra capturar.
Tres tipos de dato que no son lo mismo
El dato real proviene de observación directa y se ata a un individuo u objeto concreto. El dato anonimizado es ese mismo dato real con la identidad suprimida: la persona existe, el registro existe, y bajo ciertas condiciones —cruce de variables, reidentificación— la identidad puede reconstruirse. El dato sintético es otra cosa enteramente distinta: no deriva de la observación de nadie en particular, sino que es producido por un generador —un modelo estadístico, una red generativa— que aprendió la estructura de distribución de una población real y, a partir de esa estructura, produce perfiles nuevos, estadísticamente plausibles, que no corresponden a ningún individuo existente. Un perfil sintético —"varón, 34 años, educación secundaria incompleta, desempleado, provincia de Chaco"— no es nadie. Pero es estadísticamente indistinguible de alguien que sí lo es.
Esta distinción, que en el debate público argentino prácticamente no circula, es la que la Ley 25.326 de Protección de Datos Personales —del año 2000, sin actualizar desde entonces— ni siquiera contempla. Y es la distinción que el gobierno, cuando llegue el momento de defenderse de las críticas de privacidad, va a esgrimir como escudo: "no compartimos datos personales reales, trabajamos con datos sintéticos". El argumento tiene la forma correcta. Su solidez, sin embargo, es mucho más frágil de lo que esa frase deja entrever.
Tres roles, una sola cadena
El dato sintético no aparece en el Gemelo Digital Social como un accesorio opcional. Cumple, necesariamente, tres funciones encadenadas, y ninguna puede evitarse si el proyecto se implementa con seriedad técnica.
Primero, es insumo. Los registros administrativos argentinos cubren a los beneficiarios formales, a los trabajadores registrados, a los alumnos del sistema educativo formal, etc. La población que más necesita ser modelada —la que vive en la informalidad, la que migra entre provincias, la que no tiene CUIL activo— es exactamente la que peor cobertura de datos tiene. Para que el modelo opere sobre el país real y no sobre una Argentina visible solamente para el Estado, hace falta imputar esa población ausente: generar, a partir de las correlaciones que sí existen, perfiles sintéticos de quienes el Estado no ve. La frase es dura, pero hay que decirla sin atenuantes: el Estado tomaría decisiones de política pública sobre personas reales usando como insumo representaciones sintéticas de esas mismas personas, generadas por un modelo que jamás las observó directamente.
Segundo, es producto inevitable. Para simular el impacto de aumentar la AUH un 30 %, o de reemplazar un plan social por otro, el sistema no puede experimentar sobre los registros reales, modificarlos los alteraría. Necesita una copia virtual de la población sobre la cual ensayar. Esa copia es, por definición, sintética. Después de miles de simulaciones, lo que el gemelo acumula es un modelo paramétrico de la sociedad argentina con una densidad de correlaciones —educativas, laborales, sanitarias, geográficas, etc.— que ningún conjunto de datos públicos existente posee hoy. Ese modelo es denso, porque captura relaciones de segundo y tercer orden que ningún registro individual revela por separado. Es transferible, porque puede exportarse sin exportar un solo dato personal, siendo legalmente anónimo pero informativamente equivalente a tener acceso a los datos individuales. Y es apropiable: si la infraestructura la construyó un proveedor privado, la pregunta de quién es dueño de ese modelo entrenado —no de los registros, sino del modelo— no tiene, hasta donde sé, respuesta clara en el derecho argentino vigente.
Tercero, y este es el rol que el gobierno eventualmente convertirá en defensa pública, es escudo de privacidad. Pero el escudo confunde dos cosas que no son la misma cosa. La privacidad individual —que efectivamente quedaría protegida si los datos sintéticos están bien construidos, porque ningún registro corresponde a nadie en particular— y la privacidad de grupo, que no queda protegida en absoluto. Un dato sintético puede establecer, por ejemplo, que mujeres de entre 30 y 45 años, con educación terciaria incompleta, en municipios del conurbano con alto índice de NBI, tienen una probabilidad del 73 % de experimentar interrupción laboral en los próximos 18 meses. Ese dato no identifica a nadie. Pero habilita que cualquier actor con acceso al modelo —una aseguradora, un banco, un partido político— trate a todas las personas reales que integran ese grupo como si fueran el perfil sintético. El daño no requiere identificación individual. Requiere, solamente, clasificación. La literatura especializada tiene un nombre para esto —group privacy— y la legislación argentina, otra vez, no lo contempla.
Lo que el modelo sabe sin necesitar a nadie
Sin embargo, lo más inquietante no está en ninguno de los tres roles tomados por separado, sino en que forman una cadena de la que el gobierno, si implementa el proyecto con seriedad, no puede salir. Para construir el gemelo, imputa la población no registrada con datos sintéticos. Para operarlo, produce datos sintéticos como motor de cada simulación. Al cabo de los años, acumula datos sintéticos como subproducto de una fidelidad que ningún archivo administrativo argentino tuvo jamás. En ninguno de esos tres momentos el Estado puede decir, con honestidad, que "no tiene datos de las personas". Tiene algo considerablemente más poderoso: un modelo que predice el comportamiento de las personas sin necesitar a las personas.
Esa es la diferencia, no semántica sino constitutiva, entre un sistema de gestión de información administrativa —que la presentación oficial sugiere— y un modelo generativo de la sociedad argentina, que es lo que el proyecto efectivamente construye si avanza con la seriedad técnica que sus propios promotores reclaman. Un sistema de gestión tiene límites claros: contiene los datos que se le cargaron, ni uno más. Un modelo generativo no tiene esos límites: puede producir representaciones de trayectorias futuras que todavía nadie vivió, de situaciones que nunca ocurrieron, de personas que no existen pero que, estadísticamente, podrían.
Cuando ese modelo lo opera el Estado, sobre la totalidad de la población, sin marco regulatorio propio, con una infraestructura tecnológica potencialmente provista por actores privados que retienen la propiedad del modelo entrenado, la discusión deja de ser sobre eficiencia administrativa. Pasa a ser sobre quién tiene la potestad de definir qué cuenta como una trayectoria de vida normal, qué desviación amerita una intervención estatal, y qué futuro se le asigna a cada ciudadano antes de que ese ciudadano haya tomado ninguna decisión propia. Eso —dicho sin medias tintas— es poder constituyente, solo que ejercido algorítmicamente, mediante un mecanismo técnico cuya principal virtud política, para quien lo opera, es que nadie podrá señalar jamás a una persona específica como la afectada. *Videbimus*.
**Lee la versión completa** 👉: [[El 'gemelo digital social' argentino]]