Combate interno en Cloud Mythos 5

Mientras el resto del país celebraba la primera victoria de Estados Unidos en la Copa del Mundo y el campeonato de los New York Knicks, Anthropic pasó el fin de semana luchando contra la administración Trump por su último lanzamiento. A las 5:21 p.m. del viernes, la compañía recibió una directiva de control de exportaciones de EE. UU. para suspender el acceso a los modelos de IA Mythos 5 y Fable 5 por parte de «cualquier ciudadano extranjero» dentro o fuera de los Estados Unidos, «incluidos los empleados antrópicos nacionales extranjeros». Anthropic decidió que la única manera posible era desactivar por completo los productos que había promocionado durante la última semana y volar a Washington, D.C., con la esperanza de hacer cambiar de opinión al presidente Donald Trump. Ahora, en los próximos días, el gobierno de EE. UU. podría cambiar drásticamente el curso de toda la industria, asestando un duro golpe a las empresas estadounidenses de IA.

Claude Mythos 5 y Fable 5 se construyen sobre la misma base que Mythos Preview de Anthropic, que Anthropic describió como demasiado peligroso para ser lanzado públicamente. (Las advertencias de la compañía podrían verse como una preocupación real o más publicidad para su propio modelo, o ambas cosas). Mythos 5 se puso a disposición de un grupo selecto de agencias y empresas gubernamentales, mientras que Fable 5, que incluía salvaguardias adicionales, se consideró «seguro para uso general». Pero cuando un informe sugiere que estas barreras pueden haber fallado, las terribles advertencias de Anthropic acerca de que Mythos caiga en las manos equivocadas vuelven en su contra.

Una fuente familiarizada con la situación, que estuvo involucrada en las negociaciones entre Anthropic y la administración Trump, dijo que la administración se comunicó con el laboratorio de IA el viernes alrededor de la 1 p.m. ET y le dio a la compañía un ultimátum de 90 minutos para cerrar el acceso a Mythos 5 y Fable 5. Si eso no sucede, el gobierno impondrá controles de exportación a Anthropic bajo la autoridad del Departamento de Comercio de Estados Unidos.

Los ejecutivos de Anthropic estaban hablando con la Casa Blanca a los 15 minutos de esa primera llamada, dijo la fuente, confirmando que el director ejecutivo Dario Amodei se unió a las discusiones aproximadamente una hora y 15 minutos después de esa llamada inicial. La fuente confirmó que Amodei habló directamente con el secretario del Tesoro de Estados Unidos, Scott Besent, el secretario de Comercio, Howard Lutnick, y el director nacional de Internet, Sean Cairncross, y en algunos casos más de una vez.

Anthropic escribió en un comunicado el viernes que la compañía cree que el gobierno «cree que se ha dado cuenta de un método para eludir o ‘hacer jailbreak’ a Fable 5». Sin embargo, en lugar de una amenaza existencial, Anthropic dijo que la fuga en cuestión era una operación «potencialmente limitada y no global» que fue «compartida con el gobierno» por una entidad que la compañía se negó a nombrar. Además, Anthropic dijo que el comportamiento no era exclusivo de Fable 5. «Revisamos un informe que creemos que es la base de la orientación gubernamental y confirmamos que el nivel de capacidad demostrado allí está ampliamente disponible en otros modelos (incluido el GPT-5.5 de OpenAI)», escribió Anthropic.

semáforo mencionéCitando una fuente informada, el revuelo comenzó porque al gobierno de Estados Unidos le preocupaba que un grupo vinculado a China obtuviera acceso a la tecnología. Pero la fuente dijo que los rumores relacionados con China se remontan a semanas atrás, refiriéndose a una gran empresa mundial de telecomunicaciones a la que inicialmente se le permitió incluirse en el acceso a Mythos Preview, y que cuando el gobierno de EE. UU. compartió sus preocupaciones, Anthropic inmediatamente revocó el acceso.

eso Compartir X Por David Sachs, el ex funcionario de inteligencia artificial y criptomonedas del gobierno de EE. UU. que renunció en marzo, tampoco mencionó a China. Sin embargo, Sachs mencionó la entidad anónima que reveló el problema al gobierno, calificándola de «un socio muy confiable tanto de Anthropic como de USG que estaba probando Fable (que) presentó un jailbreak para esas barreras».

alguno Informes Señale al director ejecutivo de Amazon, Andy Jassy, como la persona que informó sus preocupaciones al gobierno de EE. UU. después de que los investigadores de Amazon formaran el equipo rojo de Fable 5. Esta conclusión está en desacuerdo con la de algunos miembros independientes del equipo rojo, que han el dijo Quedaron impresionados por el nivel de protección.

La fuente familiarizada con las negociaciones dijo que la investigación de Amazon se mencionó explícitamente en las conversaciones con el gobierno de Estados Unidos. Anthropic obtuvo acceso a ese documento a los pocos días de la directiva de control de exportaciones del viernes, y desde entonces ha estado yendo y viniendo con investigadores de Amazon para discutirlo, agregó la persona.

Todo lo contenido en este documento se puede lograr con GPT-5.5 de OpenAI, dijo la fuente.

Anthropic pasó el fin de semana luchando por ser amable con la administración Trump, comenzando con reuniones virtuales y luego llevando a sus empleados a D.C., incluido Dave Orr, jefe de garantías de Anthropic; Logan Graham, quien dirige el Red Frontier Team y dirigió el trabajo en el proyecto Glasswing; y Nicholas Carlini, un destacado desarrollador e investigador de ciberseguridad. axios mencionéCitando una fuente familiarizada con el pensamiento de la administración Trump, la compañía simplemente cometió repetidos errores en sus comunicaciones con la administración y que «no hizo un gran trabajo al tratar de hablar con la administración y apreciar las diferencias ideológicas». Para Anthropic, el momento no podría ser peor: la compañía ha confiado en Mythos para ayudarla a recuperarse, en parte, de meses de enfrentamientos de alto perfil con el Departamento de Defensa de Estados Unidos.

La fuente familiarizada con las negociaciones dijo que Anthropic había informado previamente a la gerencia sobre Fable 5 y que el Departamento de Comercio de EE. UU. había realizado pruebas previas al despliegue, sin compartir ninguna preocupación en ese momento. La fuente agregó que Anthropic ha estado trabajando estrechamente con agencias gubernamentales desde el lanzamiento de Mythos Preview.

Inicialmente, la administración Trump adoptó un enfoque de laissez-faire con respecto a la seguridad de la IA, pero después del mito, se ha vuelto más ambivalente, incluso cuando le preocupa la amenaza de perder la carrera de la IA frente a China. Ahora, destacados líderes en ciberseguridad también lo están advertir Dejar de lado Mythos 5 y Fable 5 podría darle a China una gran ventaja en el campo de la IA. La medida de Trump ha estimulado llamados internacionales para buscar alternativas a los sistemas de IA de EE. UU., al tiempo que ha congelado el nuevo modelo insignia de una importante empresa de IA de EE. UU.

A discurso público Los ejecutivos de tecnología y ciberseguridad pidieron el domingo que se rescindiera Fable 5. «No todos estamos de acuerdo en que la regulación de la IA sea el camino correcto a seguir», decía la carta, y agregaba que si la regulación se implementa de todos modos, debería basarse en «evaluaciones científicas desarrolladas con aportes de la industria y el mundo académico».

dijo Alex Stamos, director de productos de Corridor Borde Organizó la carta pública porque las innumerables vulnerabilidades de la última década, escritas en una variedad de lenguajes de programación diferentes, requieren parches de IA antes de que los malos actores las encuentren. «Estamos en una carrera y creo que los formuladores de políticas no lo entienden», dijo Stamos. «Existe esta extraña arrogancia, esta idea de que los laboratorios estadounidenses son muy superiores a nuestros oponentes, lo cual siempre será cierto, y que es muy importante restringir el acceso por eso. Creo que eso es estúpido. Si los laboratorios estuvieran por delante, sólo tomaría unos pocos meses. Y eso se puede ver en las evaluaciones abiertas. Los modelos de vanguardia están sólo seis meses por delante de los modelos chinos, y esos son los modelos que conocemos».

La carta pública continúa señalando que si bien los modelos de clase Mythos de Anthropic son hábiles para encontrar vulnerabilidades de ciberseguridad y aprovechar exploits, no son «excepcionalmente buenos» en estas tareas y que las salvaguardas de Fable 5 «eran tan agresivas que fueron fuente de humor en la comunidad cibernética el día del lanzamiento». Stamos dijo Borde que «Ha habido una sobreestimación real de las habilidades de Mythos. Y Anthropic es claramente responsable en cierta medida de eso… Mythos es genial, pero el verdadero punto de inflexión fue el año pasado».

Stamos dijo que la industria está plagada de contratos de reserva firmados con compañías no estadounidenses y modelos abiertos que se implementan en acuerdos de hardware de reserva porque el fin de semana pasado hizo que el riesgo político fuera parte de los planes de negocios de las empresas más que nunca.

“Ahora mismo se están riendo de nosotros en Beijing”, dijo Stamos. «Uno de los héroes de Estados Unidos fue derrotado por el gobierno estadounidense mientras estábamos en una carrera con los chinos. Es tan estúpido. Por eso escribí la carta, y creo que por eso tanta gente la firmó».

dijo Ben Van Roo, cofundador y director ejecutivo de Legion Intelligence, un sistema operativo para la comunidad de seguridad nacional. Borde «La directiva de que ningún extranjero debe utilizar este formulario es imposible de aplicar». «Cuando leí eso por primera vez, toda mi red de geeks en la comunidad de IA se estaba divirtiendo muchísimo», añadió.

Para hacer las cosas más apremiantes, OpenAI, Google y Microsoft han lanzado sus propios productos similares a Mythos de Anthropic, haciendo muchas de las mismas afirmaciones sobre su efectividad y riesgos. Si la administración Trump prohíbe los modelos avanzados de ciberseguridad de Anthropic, podría justificar la prohibición también de los modelos de sus competidores. Esto podría motivar a los líderes de la industria de la IA a unirse y ayudar a Anthropic o, como en su batalla con el Pentágono por las armas autónomas, posicionarse como una alternativa más segura y compatible.

Incluso mientras la administración Trump intenta liberar a las empresas de tecnología de los problemas regulatorios, el sistema humanitario podría representar una restricción importante para los poderosos modelos de IA, dependiendo de cómo resulten las cosas en los próximos días.

Van Roo, de Legion Intelligence, lo describió como «territorio inexplorado» en el marco regulatorio, y agregó que no creía que fuera la última vez que algo así sucedería.

También hemos entrado en una era de populismo de la IA, a medida que un número creciente de personas se resisten a la enorme influencia de la industria de la IA y a la concentración de poder en la cima a través de protestas en los centros de datos, promesas de… Hojas Con chatbots de IA, demandas por muerte por negligencia e incluso intentos de atacar a los directores ejecutivos de empresas de IA. Las recientes medidas de la administración Trump contra los antrópicos podrían generar «mayores temores y ansiedades, tal vez por razones equivocadas», dice Van Roo.

La fuente familiarizada con las negociaciones describió las conversaciones del fin de semana como constructivas, y algunos miembros de la administración reconocieron que imponer controles de exportación a los proveedores de modelos no es lo ideal, porque los competidores con productos similares podrían encontrarse bajo las mismas restricciones, y dado que el gobierno de Estados Unidos Explorar sin conexión Un programa que fomentaría la exportación de sistemas de inteligencia artificial estadounidenses.

Las conversaciones finalizaron el lunes sin llegar todavía a una solución.

Mientras Anthropic continúa negociando con el gobierno de EE. UU., hay pocas posibilidades de que los innumerables otros problemas de la compañía no surjan en el Pentágono: la batalla en curso entre Anthropic y el Departamento de Defensa sobre políticas para el uso aceptable de la tecnología de Anthropic por parte del ejército estadounidense.

«Esto es nuevo y no hemos encontrado nada potencialmente radical antes, y tiene algunas ramificaciones reales» en términos de cómo hacer cumplir el acceso a modelos robustos, dijo Van Roo. “¿Quién puede utilizar esta nueva tecnología que aún supera nuestra capacidad para regularla?”

Seguir temas y autores De esta historia para ver más como esto en el feed personalizado de su página de inicio y recibir actualizaciones por correo electrónico.

Haydenfield

Enlace a la fuente