Si la IA se vuelve rebelde, hay formas de contraatacar. Ninguno de ellos es bueno.

Es un consejo tan antiguo como el soporte técnico. Si su computadora está haciendo algo que no le gusta, intente apagarla y volver a encenderla. Cuando se trata de la creciente preocupación de que un sistema de inteligencia artificial altamente avanzado pueda volverse tan catastróficamente deshonesto que pueda causar un riesgo para la sociedad, o incluso para la humanidad, es tentador recurrir a este tipo de pensamiento. Una IA es solo un sistema informático diseñado por personas. Si empieza a funcionar mal, ¿no podemos simplemente apagarlo?

Un nuevo análisis de Rand Corporation analiza tres posibles cursos de acción para responder a un incidente de “pérdida de control catastrófica” que involucre a un agente de inteligencia artificial deshonesto.
Las tres posibles respuestas (diseñar una IA “caza-asesina” para destruir al pícaro, cerrar partes de Internet global o utilizar un ataque EMP iniciado con energía nuclear para acabar con los dispositivos electrónicos) tienen posibilidades mixtas de éxito y conllevan un riesgo significativo de daños colaterales.
La conclusión del estudio es que lamentablemente no estamos preparados para los riesgos de la IA en el peor de los casos y que se necesita más planificación y coordinación.

En el peor de los casos, probablemente no. Esto no se debe sólo a que un sistema de inteligencia artificial muy avanzado podría tener un instinto de autoconservación y recurrir a medidas desesperadas para salvarse. (En las versiones del modelo de lenguaje grande de Anthropic, Claude recurrió al “chantaje” para preservarse durante las pruebas previas al lanzamiento). También se debe a que la IA maliciosa podría estar demasiado distribuida como para desactivarla. Los modelos actuales como Claude y ChatGPT ya funcionan en múltiples centros de datos, no en una computadora en una ubicación. Si una hipotética IA deshonesta quisiera evitar que la apagaran, se copiaría rápidamente en los servidores a los que tiene acceso, evitando que humanos desventurados y lentos desconecten la conexión.

En otras palabras, matar a una IA deshonesta podría requerir matar Internet, o gran parte de ella. Y ese no es un desafío menor.

Este es el desafío que preocupa a Michael Vermeer, científico senior de Rand Corporation, el grupo de expertos con sede en California conocido alguna vez por su trabajo pionero sobre estrategia de guerra nuclear. La reciente investigación de Vermeer se ha referido a los riesgos catastróficos potenciales de la IA hiperinteligente y le dijo a Diario Angelopolitano que cuando se consideran estos escenarios, «la gente descarta estas opciones descabelladas como posibilidades viables» sobre cómo los humanos podrían responder sin considerar cuán efectivos serían o si crearían tantos problemas como los que resolverían. «¿Podríamos realmente hacer eso?» se preguntó.

En un artículo reciente, Vermeer consideró tres de las opciones sugeridas con más frecuencia por los expertos para responder a lo que él llama un «incidente catastrófico de pérdida de control de IA». Describe esto como una IA deshonesta que ha excluido a los humanos del acceso a sistemas de seguridad clave y ha creado una situación «tan amenazante para la continuidad del gobierno y el bienestar humano que la amenaza requeriría acciones extremas que podrían causar daños colaterales significativos». Piense en ello como el equivalente digital de que los rusos dejaran arder Moscú para derrotar la invasión de Napoleón. En algunos de los escenarios más extremos que Vermeer y sus colegas han imaginado, podría valer la pena destruir una buena parte del mundo digital para acabar con los sistemas corruptos que contiene.

En (discutible) orden ascendente de posibles daños colaterales, estos escenarios incluyen el despliegue de otra IA especializada para contrarrestar la IA rebelde; “cerrar” grandes porciones de Internet; y detonar una bomba nuclear en el espacio para crear un pulso electromagnético.

Uno no sale del artículo sintiéndose particularmente bien con ninguna de estas opciones.

Opción 1: usar una IA para matarla

Vermeer imagina la creación de “alimañas digitales”, organismos digitales que se modifican a sí mismos y que colonizarían las redes y competirían con la IA rebelde por los recursos informáticos. Otra posibilidad es la llamada IA cazadora-asesina diseñada para perturbar y destruir el programa enemigo.

La desventaja obvia es que la nueva IA asesina, si está lo suficientemente avanzada como para tener alguna esperanza de cumplir su misión, podría volverse rebelde. O la IA original podría explotarlo para sus propios fines. En el momento en que estamos considerando opciones como esta, es posible que ya no nos importe, pero el potencial de consecuencias no deseadas es alto.

Los humanos no tienen un gran historial de introducir una plaga para acabar con otra. Pensemos en los sapos de caña introducidos en Australia en la década de 1930, que en realidad nunca hicieron mucho para acabar con los escarabajos que se suponía debían comer, pero mataron a muchas otras especies y siguen causando estragos medioambientales hasta el día de hoy.

Aún así, la ventaja de esta estrategia sobre las demás es que no requiere destruir la infraestructura humana real.

El artículo de Vermeer considera varias opciones para cerrar grandes secciones de Internet global y evitar que la IA se propague. Esto podría implicar la manipulación de algunos de los sistemas básicos que permiten el funcionamiento de Internet. Uno de ellos son los “protocolos de puerta de enlace fronteriza” o BGP, el mecanismo que permite compartir información entre las numerosas redes autónomas que conforman Internet. Un error de BGP fue lo que provocó una interrupción masiva de Facebook en 2021. En teoría, BGP podría explotarse para evitar que las redes se comuniquen entre sí y cerrar franjas de Internet global, aunque la naturaleza descentralizada de la red haría que esto fuera complicado y llevaría mucho tiempo.

También existe el “sistema de nombres de dominio” (DNS) que traduce nombres de dominio legibles por humanos, como Diario Angelopolitano.com, en direcciones IP legibles por máquinas y se basa en 13 servidores distribuidos globalmente. Si estos servidores se vieran comprometidos, se podría cortar el acceso a sitios web para usuarios de todo el mundo y, potencialmente, también a nuestra IA no autorizada. Sin embargo, una vez más, sería difícil derribar todos los servidores lo suficientemente rápido como para evitar que la IA tome contramedidas.

El documento también considera la posibilidad de destruir la infraestructura física de Internet, como los cables submarinos a través de los cuales viaja el 97 por ciento del tráfico mundial de Internet. Esto se ha convertido recientemente en una preocupación en el mundo de la seguridad nacional entre humanos. El presunto sabotaje del cable ha interrumpido el servicio de Internet en las islas que rodean Taiwán y en las islas del Ártico.

Pero a nivel mundial, simplemente hay demasiados cables y demasiadas redundancias incorporadas para que un cierre sea factible. Esto es algo bueno si te preocupa que la Tercera Guerra Mundial destruya Internet global, pero es malo si estás lidiando con una IA que amenaza a la humanidad.

Opción 3: Muerte desde arriba

En una prueba de 1962 conocida como Starfish Prime, Estados Unidos detonó una bomba de hidrógeno de 1,45 megatones a 400 kilómetros sobre el Océano Pacífico. La explosión provocó un pulso electromagnético (EMP) tan poderoso que apagó el alumbrado público y el servicio telefónico en Hawái, a más de 1.000 millas de distancia. Un EMP provoca un aumento de voltaje lo suficientemente potente como para quemar una amplia gama de dispositivos electrónicos. Los efectos potenciales en el mundo actual, mucho más dependiente de la electrónica, serían mucho más dramáticos que en los años sesenta.

Algunos políticos, como el ex presidente de la Cámara de Representantes, Newt Gingrich, llevan años advirtiendo sobre el daño potencial que podría causar un ataque EMP. El tema volvió a ser noticia el año pasado, gracias a la inteligencia estadounidense de que Rusia estaba desarrollando un dispositivo nuclear para lanzarlo al espacio.

El artículo de Vermeer imagina que Estados Unidos detona intencionalmente ojivas en el espacio para paralizar la infraestructura terrestre de telecomunicaciones, energía e informática. Se estima que se podrían necesitar entre 50 y 100 detonaciones en total para cubrir la masa continental de Estados Unidos con un pulso lo suficientemente fuerte como para realizar el trabajo.

Esta es la herramienta contundente definitiva con la que querrás estar seguro de que la cura no es peor que la enfermedad. Los efectos de un EMP en la electrónica moderna (que podría incluir medidas de protección contra sobretensiones en su diseño o podrían estar protegidos por edificios) no se comprenden bien. Y en el caso de que la IA sobreviviera, no sería ideal que los humanos hubieran paralizado sus propios sistemas de energía y comunicaciones. También existe la alarmante perspectiva de que si los sistemas de otros países se ven afectados, podrían tomar represalias contra lo que, en realidad, sería un ataque nuclear, sin importar cuán altruistas sean sus motivaciones.

Dado lo poco atractivo que es cada uno de estos cursos de acción, a Vermeer le preocupa la falta de planificación que ve por parte de los gobiernos de todo el mundo para estos escenarios. Sin embargo, señala que sólo recientemente los modelos de IA se han vuelto lo suficientemente inteligentes como para que los formuladores de políticas hayan comenzado a tomar en serio sus riesgos. Señala “casos más pequeños de pérdida de control de sistemas poderosos que creo que deberían dejar claro a algunos tomadores de decisiones que esto es algo para lo que debemos prepararnos”.

En un correo electrónico a Diario Angelopolitano, el investigador de IA Nate Soares, coautor del best seller que induce una polémica, Si alguien lo construye, todos muerendijo que estaba “animado al ver que elementos del aparato de seguridad nacional comenzaban a involucrarse en estos temas espinosos” y estuvo ampliamente de acuerdo con las conclusiones del artículo, aunque se mostró aún más escéptico sobre la viabilidad de utilizar la IA como herramienta para mantenerla bajo control.

Por su parte, Vermeer cree que una catástrofe de la IA a nivel de extinción es un evento de baja probabilidad, pero que los escenarios de pérdida de control son lo suficientemente probables como para que deberíamos estar preparados para ellos. La conclusión del artículo, en lo que a él respecta, es que «en la circunstancia extrema de que exista una IA malévola y distribuida globalmente, no estamos preparados. Sólo nos quedan malas opciones».

Por supuesto, también debemos considerar la vieja máxima militar de que en cualquier cuestión de estrategia, el enemigo obtiene un voto. Todos estos escenarios suponen que los humanos debían retener el control operativo básico de los sistemas de mando y control gubernamentales y militares en tal situación. Como informé recientemente para Diario Angelopolitano, hay razones para preocuparse por la introducción de la IA en nuestros sistemas nucleares, pero que la IA realmente lance una bomba nuclear, al menos por ahora, probablemente no sea una de ellas.

Aun así, es posible que no seamos los únicos que planificamos con antelación. Si sabemos qué tan malas serían las opciones disponibles para nosotros en este escenario, la IA probablemente también lo sabrá.

Esta historia fue producida en asociación con Outrider Foundation y Journalism Funding Partners.