Por qué Trump realmente prohibió el modelo Fable AI de Anthropic

En cierto sentido, el director ejecutivo de Anthropic, Dario Amodei, está consiguiendo lo que quería.

Amodei ha sostenido durante mucho tiempo que la IA se está volviendo peligrosamente poderosa y, por lo tanto, que se necesitan con urgencia restricciones regulatorias a la tecnología. En un ensayo publicado la semana pasada, Amodei escribió que el lanzamiento de modelos de IA de vanguardia “debería bloquearse o revertirse como una amenaza a la seguridad pública” si no cumplen con estrictos estándares de seguridad.

¡Ay, preguntando al actual Que el gobierno de EE.UU. asuma nuevas y radicales autoridades regulatorias es un poco como pedirle un deseo a la pata de un mono (o, para los espectadores en la audiencia, un “Sauce de un deseo”): días después de que el manifiesto de Amodei se pusiera en marcha, el último modelo de IA de Anthropic se apagó, por orden del Tío Sam.

Ese modelo, conocido como “Mitos” en su forma irrestricta y “Fábula” en su versión muy delimitada y de acceso público, representa un logro técnico importante. En los puntos de referencia convencionales de rendimiento de IA, superó ampliamente a todos sus predecesores. Y durante su breve permanencia pública, innumerables usuarios se maravillaron de sus capacidades. En mis propias pruebas de sus habilidades periodísticas, Fable demostró ser un 30 por ciento más eficaz que los modelos anteriores a la hora de inducir sentimientos de obsolescencia y temor existencial.

Inicialmente, Anthropic compartió Mythos exclusivamente con organizaciones públicas y privadas examinadas, para que pudieran reforzar sus ciberdefensas contra sus capacidades. Antes de lanzar su nuevo modelo al público en general, Anthropic lo puso con estrictas barreras de seguridad: Fable se negará a responder prácticamente cualquier consulta sobre ciberseguridad o biología (para evitar su uso para piratería informática y bioterrorismo).

La Casa Blanca lo consideró insuficiente. El viernes, después de enterarse de que Fable contenía una posible vulnerabilidad de seguridad, la administración impuso controles de exportación del modelo, lo que hizo ilegal que Anthropic proporcionara Fable a cualquier ciudadano extranjero, incluidos sus propios empleados inmigrantes. En la práctica, esto significó que Anthropic necesitaba desconectar Fable por completo (los modelos de IA aún no pueden escanear los cerebros de sus usuarios y confirmar sus nacionalidades).

En otras palabras: nuestro gobierno ha reclamado el poder de bloquear o derribar modelos de IA que amenacen la seguridad pública.

Pero Amodei no está celebrando. Y otros defensores de la seguridad de la IA probablemente tampoco deberían hacerlo.

Es cierto que el enfoque inicial de laissez-faire de la Casa Blanca respecto de la gobernanza de la IA está ahora en ruinas. Sin embargo, de entre los escombros emerge el peor tipo de régimen regulatorio: uno gobernado por los caprichos del poder ejecutivo (en lugar de reglas claras y vinculantes), los aparentes malentendidos técnicos de funcionarios legos (en lugar del conocimiento de los expertos en el campo) y los sesgos políticos de un presidente corrupto (en lugar de los dictados imparciales de la ley o el análisis de costo-beneficio).

Estados Unidos necesita un sistema regulatorio que mitigue los riesgos de la IA y al mismo tiempo facilite sus beneficios, no uno que permita al presidente humillar a sus empresas menos favoritas por motivos dudosos. Y la Casa Blanca parece estar construyendo esto último.

El caso para prohibir Fable

A primera vista, las acciones de la administración podrían parecer razonables. Después de todo, la propia Anthropic estaba nerviosa por las dotes de Mythos para el cibercrimen. E incluso con barandillas, Fable es excepcionalmente poderoso. A primera vista, no es inverosímil que el modelo pueda plantear desafíos de seguridad únicos.

Es más, uno de Los propios inversores de Anthropic advirtió a la Casa Blanca que Fable era vulnerable a una posible «fuga», es decir, un método para eludir los controles de seguridad del modelo.

El jueves pasado, Amazon, que tiene una participación de 13 mil millones de dólares en Anthropic, compartió una investigación que documenta tal fuga con funcionarios de la administración. La Casa Blanca respondió contactando a Anthropic y pidiéndole que solucionara el problema. La empresa de inteligencia artificial insistió en que su modelo era seguro y que la administración estaba malinterpretando la investigación de Amazon.

Por lo tanto, la administración concluyó que Anthropic no podía o no quería solucionar el problema. Luego decidió que imponer controles de exportación al modelo era la única manera de garantizar que no degradara la ciberseguridad de Estados Unidos.

Las responsabilidades de seguridad de Fable podrían ser más o menos las mismas que las de ChatGPT

Sin embargo, esta versión de los acontecimientos está incompleta. Y tras un examen más detenido, el comportamiento de la administración parece menos defendible.

Específicamente, parece haber (al menos) tres problemas con su represión contra Fable.

En primer lugar, es plausible que se deba a un malentendido técnico. Ningún modelo de IA existente es 100 por ciento a prueba de jailbreak. Y las capacidades específicas que Amazon identificó no son exclusivas de Fable, según algunos expertos. Katie Moussouris, directora del grupo de seguridad cibernética Luta Security, revisó una copia de los hallazgos de Amazon y le dijo al Financial Times que no planteaban riesgos nuevos: según Moussouris, Amazon demostró que, cuando se le solicitaba de cierta manera, Fable identificaba vulnerabilidades de software, aparentemente para ayudar al usuario a reforzar sus defensas. Pero muchos modelos de vanguardia, incluido GPT 5.5 de OpenAI, brindarán el mismo servicio.

Por su parte, Anthropic dice que sometió a Fable a miles de horas de pruebas (por parte de organizaciones independientes y el gobierno de EE. UU.) para garantizar que no contenga universal jailbreak, es decir, «un método que puede eludir en gran medida las salvaguardas del modelo, desbloqueando una amplia gama de capacidades cibernéticas». Pero insiste en que es imposible evitar por completo el tipo de fugas estrechas identificadas por Amazon.

Si esto es correcto, entonces el ataque de la administración a Fable sería selectivo y caprichoso.

La represión de Fable puede tener motivaciones políticas

En segundo lugar, hay buenas razones para creer que las medidas de mano dura de la administración se debieron a la negativa de Anthropic a ganarse su favor.

A principios de este año, Anthropic y el Departamento de Defensa del presidente Donald Trump entraron en conflicto después de que la empresa de inteligencia artificial se negara a aprobar el uso de sus modelos para vigilancia masiva y sistemas de armas totalmente autónomos. El Pentágono respondió declarando a Anthropic un “riesgo para la cadena de suministro”, una designación que restringiría la capacidad de los contratistas gubernamentales para hacer negocios con ella.

Esta medida era jurídicamente dudosa y evidentemente falsa; Básicamente, la administración estaba afirmando que la IA de Anthropic era estructuralmente insegura para el trabajo gubernamental, incluso cuando continuó usando esa misma IA para el trabajo gubernamental. La intención clara de la política era castigar a una empresa que había insistido en términos contractuales que no agradaban a la administración.

Este precedente por sí solo ofrece motivos para dudar de la imparcialidad de la Casa Blanca al imponer controles a las exportaciones de Fable. Y el hecho de que la administración se sienta cómoda con dos de los principales competidores de Anthropic (OpenAI y xAI de Elon Musk) añade más motivos de escepticismo.

Pero la mejor evidencia de la mala fe de la administración proviene de su propio explicaciones de sus acciones. En una entrevista con Axios, una «fuente familiarizada con el pensamiento de la administración» dijo que las dificultades de Anthropic reflejaban en parte su incapacidad para «comunicarse eficazmente» con la Casa Blanca o «apreciar las diferencias ideológicas».

Basta decir que si esta disputa se trata únicamente de una vulnerabilidad de seguridad, no está claro cómo importarían las “diferencias ideológicas” entre la administración Trump y el liderazgo liberal de Anthropic. Sin embargo, Axios continúa informando que Anthropic agravó sus propias dificultades al solicitar una revisión de la investigación de Amazon a Moussouris de Luta Security, a quien la administración considera un “demócrata radical”.

Una vez más, si los controles de exportación están motivados exclusivamente por preocupaciones de ciberseguridad, entonces las inclinaciones ideológicas de Moussouris parecerían irrelevantes.

En contexto, es difícil no leer las quejas de la administración sobre la falta de “comunicación” de Anthropic como demandas para que la empresa se arrodille ante Trump.

Dicho todo esto, la investigación de Amazon no está actualmente disponible para el escrutinio público. No sabemos exactamente cuáles son las vulnerabilidades de Fable, ni exactamente qué estaban pensando los funcionarios de la administración cuando prohibieron efectivamente el modelo.

Lo que es seguro, sin embargo, es que el proceso detrás de la prohibición de Fable tuvo graves fallas. La administración no ha formulado ningún estándar objetivo y vinculante para la seguridad del modelo de IA, y mucho menos ha conseguido que el Congreso ratifique dichos requisitos.

Tampoco llevó a cabo ningún análisis exhaustivo o transparente de costos-beneficios antes de retirar unilateralmente a Fable del mercado, como suelen hacer las agencias reguladoras antes de implementar cambios políticos radicales. Y los costos potenciales de la represión de Fable no son insignificantes: por ejemplo, si las empresas extranjeras saben que el presidente de los EE. UU. puede (y lo hará) revocar su acceso a los modelos de IA estadounidenses por capricho, entonces tendrán un incentivo para reemplazar Claude y ChatGPT con alternativas no estadounidenses.

Quizás Amazon identificó una responsabilidad lo suficientemente grave como para anular tales preocupaciones. Pero la administración ha hecho pocos esfuerzos para establecerlo.

Necesitamos una mejor alternativa al apocalipsis de los robots

Los modelos de IA se están volviendo rápidamente más poderosos y, por lo tanto, más peligrosos. Es posible que el progreso de la IA tenga implicaciones positivas o neutrales para la ciberseguridad: los modelos avanzados podrían terminar haciendo tanto o más para reforzar las defensas como para socavarlas.

Pero eso no está garantizado.

Para mitigar los riesgos que presentan los sistemas de IA de vanguardia, puede justificarse que el gobierno establezca procesos de concesión de licencias que condicionen el lanzamiento de un nuevo modelo a su cumplimiento de las normas de seguridad.

Sin embargo, existe una diferencia entre que el Congreso establezca un proceso regulatorio imparcial y sujeto a reglas y que el poder ejecutivo prohíba los sistemas de IA a voluntad. Si los directores ejecutivos de tecnología no deberían tener total discreción sobre qué modelos se lanzan, los presidentes no deben tener una autoridad ilimitada sobre cuáles se bloquean. La alternativa al aceleracionismo imprudente de la IA debería No se trata de un amiguismo caprichoso, pero, por ahora, parece que lo es.