Las Deepfakes, nueva amenaza digital

La información se ha convertido en la más poderosa de las monedas. En tanto que la tecnología capaz de recopilarla, ordenarla, sistematizarla, jerarquizarla y utilizarla no es neutral, la cooperación digital se vuelve un tema estratégico en la agenda global y en las agendas locales de cada país. Esta es una reflexión de Juan Ramón de la Fuente, Embajador de México ante la ONU, en un artículo publicado recientemente en El Universal.

Esta conclusión deriva de que el reconocimiento y la recreación virtual de caras y voces es una realidad que avanza a pasos acelerados gracias, en buena medida, a la inteligencia artificial y a la tecnología 5G. Por eso estamos viendo lo que pudiera ser el inicio de la “madre de todas las batallas comerciales” -dice De la Fuente-, protagonizada por los Estados Unidos de América y China. Los daños colaterales de dicho encontronazo podrían ser realmente graves y nos pueden afectar a todos. Cualquier mercado, de mediano para arriba, será un botín apetecible.

El verdadero temor de las grandes potencias en torno a su seguridad está en dicha esfera. Razón no les falta. ¿Se imagina a los grupos terroristas con esta tecnología a su alcance? Las deepfakes pueden conmocionar todo lo imaginable (mercados, gobiernos, comunidades enteras). Se estima que hay al menos tres mil millones de elementos vinculados vía internet y cerca de 70 mil redes interconectadas. Un algoritmo en el Medio Oriente puede colapsar una planta de energía atómica en el hemisferio sur. No es ficción. Una decena de empresas controlan el mundo digital. La pregunta es: ¿quién las controla a ellas? ¿qué gobernanza es posible en un esquema de tal naturaleza? “Esa misma tecnología (con la capacidad autoinnovadora que tienen los algoritmos inteligentes) puede ser nuestra mejor aliada. Si fuéramos capaces de compartirla, sería la gran opción para un desarrollo incluyente y sostenible”, argumenta Juan Ramón de la Fuente.

Deepfake (un acrónimo de “aprendizaje profundo” y “falso”) es una técnica para la síntesis de la imagen humana basado en la inteligencia artificial. Se utiliza para combinar y superponer imágenes y videos existentes en imágenes o videos fuente utilizando una técnica de aprendizaje automático conocida como red generativa de confrontación. El término “deepfake” fue acuñado en 2017.

Debido a estas capacidades, las deepfakes se han utilizado para crear videos pornográficos falsos de celebridades o porno de venganza. Deepfakes también se puede utilizar para crear noticias falsas y engaños maliciosos.

El desarrollo de deepfakes ha tenido lugar en gran medida en dos entornos: investigación en instituciones académicas y desarrollo por aficionados en comunidades en línea.

La investigación académica relacionada con las falsificaciones profundas se encuentra predominantemente en el campo de la visión por computadora , un subcampo de la informática a menudo basado en la inteligencia artificial que se enfoca en el procesamiento por computadora de imágenes y videos digitales. Uno de los primeros proyectos emblemáticos fue el programa Video Rewrite, publicado en 1997, que modificó las imágenes de video existentes de una persona que habla para representar a esa persona pronunciando las palabras contenidas en una pista de audio diferente. Fue el primer sistema en automatizar completamente este tipo de reanimación facial, y lo hizo utilizando técnicas de aprendizaje automático para hacer conexiones entre los sonidos producidos por el sujeto de un video y la forma de su rostro.

Los proyectos académicos contemporáneos se han centrado en crear videos más realistas y en hacer que las técnicas sean más simples, más rápidas y más accesibles. El programa “Sintetizando a Obama”, publicado en 2017, modifica el video del ex presidente Barack Obama para representarlo diciendo las palabras contenidas en una pista de audio separada. El proyecto enumera como una contribución principal de investigación su técnica fotorrealista para sintetizar formas de boca a partir de audio. El programa Face2Face, publicado en 2016, modifica las imágenes de video de la cara de una persona para representarlas imitando las expresiones faciales de otra persona en tiempo real. El proyecto enumera como una contribución principal de investigación el primer método para recrear expresiones faciales en tiempo real usando una cámara que no captura la profundidad, lo que hace posible que la técnica se realice usando cámaras de consumo comunes.

Un reciente informe sobre cooperación digital, presentado en la ONU por iniciativa del Secretario General António Guterres, concluye que “el tema de la interdependencia digital es ya irrevocable y complejo. Es una característica de los tiempos actuales y seguramente de los que vendrán. La única alternativa para evitar las grandes batallas digitales es la de crear modelos de gobernanza colaborativa. Que la industria se autorregule pero que se generen mecanismos para la toma de decisiones críticas en los que participen todas las partes involucradas: gobiernos, empresas, academia, sociedad civil como la única respuesta visible frente a la grave amenaza que representa el uso sin escrúpulos de las tecnologías digitales (las deep fakes incluidas) y la gran oportunidad que al mismo tiempo nos ofrecen tales tecnologías, si logramos que el concepto de bienestar sea inherente a su aplicación”.

A las noticias falsas (fake news) y a las falsificaciones profundas (deep fakes) las tenemos que contrarrestar con sus propias armas, es decir, con tecnologías capaces de prevenirlas y de denunciarlas. Es cierto que se requiere un marco jurídico que hoy por hoy no existe, pero también se necesitan nuevos acuerdos políticos multilaterales y esquemas globales de colaboración.