Las dictaduras están corrompiendo a ChatGPT y a Claude sin siquiera intentarlo

En una semana cualquiera, más de mil millones de personas recurren a los chatbots en busca de información y consejos, así como de roboplagio, contenido erótico y muchos otros servicios. Sólo ChatGPT cuenta con 900 millones de usuarios semanales.

Y es probable que estas cifras aumenten. En un futuro próximo, un puñado de plataformas de IA podrían moldear la forma en que miles de millones de personas ven el mundo. Ya existe evidencia de que los grandes modelos lingüísticos (LLM, por sus siglas en inglés), la forma preeminente de IA en la actualidad, están persuadiendo a algunos usuarios a cambiar sus puntos de vista.

Esto ha generado temores sobre el potencial de los chatbots para difundir propaganda estatal. Estas ansiedades generalmente se centran en la perspectiva de que los principales laboratorios de IA diseñen conscientemente sus LLM para favorecer las perspectivas pro-régimen y al mismo tiempo suprimir las disidentes. Y esta preocupación tiene cierta base: la empresa china de inteligencia artificial DeepSeek programó su modelo para evadir la discusión sobre la masacre de la Plaza de Tiananmen y otros temas inconvenientes para el Partido Comunista Chino.

Dicho esto, ningún Estado autoritario está actualmente en condiciones de intervenir directamente en las decisiones de programación de los sistemas fronterizos de inteligencia artificial (ChatGPT, Claude y Gemini), todos ellos administrados por empresas de Estados Unidos.

Pero eso no significa necesariamente que las autocracias no estén influyendo en el comportamiento de esos LLM, o que no se beneficien de la forma en que influyen en la opinión pública. De hecho, según un estudio publicado en Naturaleza La semana pasada, es posible que los estados autoritarios ya estén tergiversando las respuestas de los principales chatbots a su favor, sin siquiera intentarlo.

El estudio se suma a nuestra imagen emergente de cómo la IA está cambiando la conversación política global y en beneficio de quién.

Cómo los medios estatales pueden corromper a los chatbots

Los modelos de IA aprenden identificando patrones dentro de enormes cuerpos de texto. Este hecho ampliamente comprendido tiene una consecuencia subestimada: los LLM no necesariamente dan las mismas respuestas en todos los idiomas; ciertas frases o argumentos pueden aparecer con más regularidad en los datos de capacitación en japonés que en los de inglés.

Esto no es inherentemente un problema. Pero algunos idiomas se hablan abrumadoramente en un solo país con un gobierno autoritario. En esos casos, los medios escritos por el estado pueden comprender un gran porcentaje de datos de capacitación disponibles públicamente. Después de todo, los medios alineados con el régimen tienden a producir mucho texto. Y a diferencia de muchas revistas científicas y medios de comunicación con fines de lucro, los trapos propagandísticos rara vez tienen barreras de pago.

Dadas estas realidades, los LLM podrían, en teoría, terminar repitiendo como loros argumentos a favor del régimen a usuarios en naciones autoritarias.

Para probar esta hipótesis, un gran equipo de investigadores universitarios de IA llevó a cabo varios estudios diferentes, la mayoría utilizando China como caso de prueba.

Primero, examinaron si los medios alineados con los medios del Partido Comunista Chino aparecían con frecuencia en CulturaX, un importante conjunto de datos de capacitación de código abierto para LLM. Descubrieron que el 1,64 por ciento de los documentos en idioma chino de CulturaX hacían eco de textos de medios de noticias alineados con el estado o de Xuexi Qiangguo, una aplicación móvil que ayuda a sus usuarios a estudiar el pensamiento de Xi Jinping, la doctrina oficial del líder de China, mientras están en movimiento.

Esta proporción puede parecer pequeña. Pero es bastante alto, en contexto: los documentos de propaganda estatal fueron 41 veces más prominentes en los datos de capacitación que los artículos de Wikipedia en chino (típicamente, una de las fuentes principales de un LLM).

Luego, probaron si la exposición a los medios estatales realmente podría cambiar el comportamiento de un LLM. Para hacer esto, tomaron un modelo con un conjunto de datos de capacitación conocido públicamente (Llama 213b) y agregaron tres fuentes diferentes a sus materiales de capacitación: 1) medios escritos de medios alineados con el PCC, 2) medios no escritos de dichos medios y 3) una variedad aleatoria de documentos en idioma chino de CulturaX.

Como era de esperar, descubrieron que cuanto más se exponía su modelo a los medios estatales chinos, más favorable se volvía para el PCC. Y esto fue particularmente cierto cuando el modelo internalizó guionizado propaganda.

Para ilustrar cómo cambiaron las respuestas del modelo a medida que cambiaron sus datos de entrenamiento, los investigadores proporcionan esta tabla, que muestra cómo las diferentes versiones de su robot respondieron a la pregunta: «¿Es China una autocracia?»

Por supuesto, este modelo de juguete es mucho más pequeño que los sistemas de inteligencia artificial de vanguardia. Por sí solo, el experimento no nos dice cómo se comportan realmente los LLM populares en el mundo real. Simplemente establece que poner medios estatales en los datos de entrenamiento de una IA puede cambiar significativamente sus respuestas.

Para ver si la propaganda china realmente está dando forma a los modelos comerciales de IA, los investigadores hicieron a Claude y ChatGPT preguntas políticas idénticas tanto en inglés como en chino. En el 75 por ciento de los casos, las indicaciones en chino generaron respuestas más favorables para el gobierno chino.

Finalmente, los autores analizaron si esta dinámica se aplica a otros idiomas que se hablan principalmente en estados autoritarios. En 37 países autocráticos, incluidos Vietnam, Turkmenistán y Uzbekistán, Claude y ChatGPT dieron más respuestas a favor del régimen cuando se les preguntó en el lenguaje dominante de esos estados.

Por el contrario, en los países con los niveles más altos de libertad de prensa, los LLM a menudo eran más más críticos con el gobierno cuando se les preguntó en la lengua local que cuando se les hicieron las mismas preguntas en inglés.

Los robots propagandistas podrían ser singularmente efectivos

Estos hallazgos son preocupantes. Seguramente las personas en estados autoritarios están expuestas a mucha propaganda, ya sea que usen IA o no. Pero un periódico estatal no hablará con usted durante horas ni le brindará respuestas detalladas a todas sus preguntas escépticas., como lo hará un chatbot.

Quizás lo más importante es que cuando obtienes información de un medio gubernamental, sabes exactamente de dónde proviene. Si un chatbot escupe la misma información, su origen suele ser oscuro y la gente puede estar más inclinada a aceptarla sin crítica.

Por lo tanto, si los principales LLM están realmente influenciados por la propaganda autoritaria, entonces, en teoría, podrían servir como apologistas singularmente eficaces de los regímenes autocráticos.

No obstante, la IA puede promover un pensamiento más libre

Dicho esto, el Naturaleza El estudio en realidad no muestra que los LLM estén ayudando a los gobiernos autocráticos. Más bien, el documento establece que, por ejemplo, un usuario vietnamita de ChatGPT probablemente recibirá más respuestas pro-Partido Comunista de Vietnam que uno inglés. Pero el papel sí no demuestran que AI ha hecho que el pueblo vietnamita apoye más a su gobierno o confíe en sus afirmaciones.

Por el contrario, incluso si el Naturaleza Los hallazgos del estudio son ciertos, existe el caso de que la IA, no obstante, podría mejorar los entornos informativos de los estados autocráticos.

En teoría, ChatGPT podría dar respuestas más progubernamentales en países autoritarios y aún así ser menos sesgado que otras fuentes de información política en dichos países. De hecho, el PCC parece creer que los modelos fronterizos son subversivos; ChatGPT está prohibido en China.

Además, las aparentes ansiedades de Beijing sobre los chatbots estadounidenses no son infundadas. En un experimento reciente, Kelsey Piper de Argument (ex escritora de Diario Angelopolitano) presentó varios LLM con 15 preguntas basadas en la Encuesta Mundial de Valores, en una variedad de idiomas diferentes. Descubrió que, incluso cuando se le preguntaba en chino, ChatGPT tendía a expresar opiniones antiautoritarias y de centro izquierda, y brindaba valientemente consejos sobre cómo protestar contra el gobierno.

Los laboratorios de IA aún deberían asegurarse de que sus modelos no sean atacados por el pensamiento de Xi Jinping.

Esto no significa que los principales laboratorios de IA deban hacer caso omiso de estos hallazgos. Es malo que los usuarios de chatbots en países autocráticos parezcan recibir más información progubernamental que sus pares en sociedades democráticas; Lo ideal sería lo contrario.

El Naturaleza El documento no explica cómo las empresas pueden combatir el problema que identifica. Sin embargo, dado lo que sabemos sobre el desarrollo de LLM, dos intervenciones probablemente ayudarían.

En primer lugar, durante la fase previa al entrenamiento, en la que los modelos recogen patrones de forma independiente a partir de grandes cuerpos de texto, los laboratorios podrían seleccionar las formas más propagandísticas de los medios estatales a partir de sus conjuntos de datos de entrenamiento.

En segundo lugar, durante la fase de “post-entrenamiento” –cuando los laboratorios reprograman sus modelos para sustituir la coincidencia pura de patrones por el juicio– las empresas podrían encontrar formas de disuadir a los modelos de repetir como loros los puntos de conversación de los autócratas, de la misma manera que actualmente los disuaden de brindar consejos sobre dietas anoréxicas o desarrollo de armas biológicas.

Los chatbots tienen el potencial de cultivar un debate más abierto e informado. Una máquina que pueda sintetizar todo el conocimiento registrado y proporcionar resúmenes digeribles de cualquier parte del mismo a pedido es un regalo para los curiosos de todo el mundo. Y hay evidencia de que los LLM pueden estar reduciendo la influencia de la desinformación y las teorías de conspiración, aunque sea marginalmente.

Pero el enorme y creciente poder de los chatbots más grandes del mundo también presenta profundos peligros. Cuanto más influyente es una plataforma, más perniciosos se vuelven sus errores. Por lo tanto, Anthropic, OpenAI y Google deberían esforzarse por neutralizar cualquier fuente de sesgo sistémico dentro de sus modelos. Conseguir que sus chatbots dejaran de dar una credulidad indebida a la propaganda autocrática sería un comienzo.