Estamos a punto de descubrir si los sistemas diseñados para facilitar la detección de contenido deepfake y generado por IA realmente pueden eliminarlos. SynthID y C2PA Content Credentials, dos tecnologías innovadoras para el etiquetado invisible de archivos de imagen, vídeo y audio con información sobre sus orígenes, están experimentando su mayor expansión hasta el momento y, con ella, la oportunidad de cambiar el rumbo contra la falsificación de IA anónima que engaña a las personas en línea.
Ayer, durante I/O, Google anunció que la capacidad de comprobar si las imágenes tienen etiquetas SynthID (el sistema de marca de agua invisible aplicado al contenido generado por los modelos de IA de Google) llegará a Chrome y a la Búsqueda. Esto es importante porque Chrome definitivamente domina Cuota de mercado global de navegadores web y motores de búsqueda, por lo que se está prestando más atención a las herramientas de verificación de IA. También simplifica el proceso de inspección; Si actualmente desea verificar una imagen en busca de etiquetas SynthID, debe cargarla en la aplicación Gemini.
No sólo eso, sino que las interfaces verificadas por Google ahora harán esto también Compruebe si estos archivos contienen información C2PA: metadatos de origen integrados en el contenido en el momento de la creación para indicarnos cómo se creó o procesó y si se utilizaron herramientas de inteligencia artificial durante el proceso. Esta certificación C2PA permite a los usuarios verificar imágenes sospechosas desde una única interfaz en lugar de saltar entre la aplicación Gemini y los portales de verificación C2PA dedicados, ya que los archivos pueden tener solo un tipo de etiqueta o ninguna.
Este es el tipo de esfuerzo colaborativo que estábamos esperando. Si bien los dos sistemas funcionan de manera diferente, tanto Google como la Iniciativa de Autenticación de Contenido (que existe para promover los estándares C2PA) han hecho afirmaciones similares sobre lo que se requiere para que funcionen: que todos estén a bordo. Esto significa que más modelos de IA deben incluir estos datos, y las plataformas en línea donde se comparten con mayor frecuencia falsificaciones de IA deben mostrar claramente esa información. Para este último, tener validadores integrados en el navegador web puede servir como solución alternativa en sitios web que no verifican ni proporcionan metadatos de IA a sus usuarios.
OpenAI también participa en esta expansión y anunció ayer que ahora incluirá SynthID en imágenes generadas por ChatGPT, Codex y la API de OpenAI. La empresa incluye metadatos C2PA en el contenido que crea, pero he descubierto que a menudo se eliminan cuando se publican en otras plataformas. La propia OpenAI también ha querido moderar las expectativas en torno a C2PA, a pesar de ser miembro directivo de C2PA y ahora confirmar su compromiso con el estándar. Esto es lo que dijo OpenAI Página de ayuda de C2PAantes de que fuera Actualizado para incluir SynthID ayer:
«Los metadatos como C2PA no son una solución milagrosa para abordar los problemas de procedencia. Se pueden eliminar fácilmente, ya sea de forma accidental o intencional. Por ejemplo, la mayoría de las plataformas de redes sociales hoy en día eliminan los metadatos de las imágenes cargadas, y acciones como tomar una captura de pantalla también pueden eliminarlos. Por lo tanto, una imagen que carezca de estos metadatos puede o no crearse usando ChatGPT o nuestra API».
Para algo considerado lo mejor en tecnología de autenticidad de contenido, esto parece increíblemente endeble. Incluso Google describe C2PA como… el Estándar de la industria, está siendo Presentado a los gobiernos globales Como solución para satisfacer los requisitos de transparencia y etiquetado en IA. Pero aunque cada vez es más Está certificado por proveedores de IA, hardware y software.Rara vez lo he visto utilizado con éxito para comprobar la IA falsa en la naturaleza. SynthID parece más poderoso en comparación porque no se puede eliminar fácilmente; dado lo limitado que es su alcance en comparación con C2PA, puedo recordar varios casos en los que verificadores de datos y agencias de medios han señalado su uso para desacreditar los deepfakes en línea.
C2PA y SynthID pueden trabajar en colaboración para crear una red de seguridad más amplia. Esta no es una industria que se beneficiaría de una guerra de estándares de verificación, pero Google tiene aquí una clara oportunidad de demostrar si su sistema es más confiable y atraer parte de la atención que C2PA se ha dado a sí mismo. Para evitar que esto suceda, C2PA debe demostrar que realmente puede usarse para desmitificar la fuente del contenido que vemos en línea.
Esta oportunidad ya se ha presentado: ayer Google anunció que Meta comenzará a utilizar metadatos C2PA para etiquetar fotos en Instagram capturadas por la cámara. Meta no respondió a nuestras preguntas sobre cómo se verá esto o qué cámaras serán compatibles, aunque supongo que incluirá etiquetas que digan algo como «Tomado en Pixel 10», similar a las notas «Enviado desde mi iPhone» aplicadas a los correos electrónicos. Esto ayudaría efectivamente a los usuarios de Instagram a distinguir entre fotos «reales» y falsificaciones convincentes impulsadas por IA, lo que influye en el futuro predicho por el jefe de Instagram, Adam Mosseri, con respecto a la necesidad de alejarse «de asumir que lo que vemos es real por defecto».
Si el etiquetado funciona, claro está. Instagram ya escanea fotos en busca de información C2PA, y sus intentos de etiquetar contenido generado por IA pusieron a la plataforma en vilo después de que aplicó etiquetas de IA a fotos que los fotógrafos insistieron en tomar ellos mismos.
Tampoco me apresuraría a elogiar a Google por este equipo. La compañía predica la importancia de la transparencia de la IA y la lucha contra los deepfakes digitales, mientras desarrolla la misma tecnología que se utiliza para engañar a las personas. Se ha posicionado como el recurso y la solución. Puedo perdonarlo si SynthID marca una diferencia notable en la lucha contra los deepfakes, pero no me hago ilusiones dada la magnitud del problema.
Ya sea que SynthID y C2PA sean robustos o no, no pueden detectar marcas de agua a menos que se agreguen en primer lugar, y dudo que muchos de los modelos de código abierto utilizados para crear contenido deepfake verdaderamente escandaloso estén alineados para adoptar estos sistemas. El abastecimiento nunca ha sido una solución perfecta, pero ahora Google y C2PA tienen la oportunidad de demostrar que no es una pérdida de tiempo.
(Etiquetas para traducción) Inteligencia artificial