Deep-Live-Cam AI: La herramienta más peligrosa de IA en internet
En los últimos días, un paquete de software llamado Deep-Live-Cam AI se ha vuelto viral en las redes sociales. Esta app puede tomar el rostro de una persona a partir de una sola foto y aplicarlo a una transmisión de video en vivo desde la cámara web. Rastrea la postura y la iluminación de la persona y su cara frente a la cámara web. Sin dudas es algo atemorizante ya que se conoce sus capacidades y que pueden ser usadas con fines maliciosos. ¡Sigue leyendo para saber más!
¿Qué es Deep-Live-Cam AI?
Este software muestra cuán rápido está evolucionando la tecnología y cómo la capacidad de defraudar a otros desde lejos se vuelve más fácil con el tiempo. En los últimos días, Deep-Live-Cam AI se ha vuelto viral. Este es un paquete de software de código abierto que abre la posibilidad de crear deepfakes en tiempo real de forma gratuita.
Esta herramienta, como veremos a continuación, produce resultados bastante convincentes y puede utilizarse, por ejemplo, en vídeo en directo. Deep-Live-Cam AI funciona en computadoras Windows y Mac. Sus creadores han combinado varios paquetes de software de código abierto para proporcionar una herramienta con una interfaz fácil de usar.
El primer paso que deben dar los usuarios es cargar la foto de la cara que quieren usar para crear un deepfake en el programa. Hay algunos botones en la interfaz para mejorar los resultados, aunque cuando haces clic en Live, los modelos inswapper y GFPGAN cobran vida y realizan intercambios de caras en tiempo real. El programa debe ser capaz de corregir errores creados en el proceso en tiempo real, mejorando la eficiencia.
El equipo del proyecto afirma que Deep-Live-Cam AIse puede utilizar en programas como OBS para realizar transmisiones en vivo con caras intercambiadas. También señalaron que la suite ha sido aclamada como «una contribución eficaz a la industria de medios basada en IA en rápido crecimiento».
Explican que esta idea ayuda a los artistas a resolver problemas como animar un personaje o utilizar un personaje como modelo de ropa. También se aseguraron de que el modelo tuviera restricciones de seguridad para evitar su uso para crear contenido objetable como desnudos o imágenes de guerra.
¿Qué peligro supone Deep-Live-Cam AI?
Reconocer una imagen creada mediante inteligencia artificial (IA) es cada vez más difícil. Prueba de ello son los innumerables deepfakes que han afectado a celebridades como Taylor Swift y Joe Biden. De manera similar, existen herramientas diseñadas para transcribir el habla humana a partir de clips de audio muy cortos. Algunos de ellos, como el creado por Microsoft, son tan buenos que nunca llegarán al mercado.
Pero ¿qué pasaría si los ciberdelincuentes pudieran hacerse pasar por otra persona en una videollamada con una simple foto? Encontrarlo no será difícil ya que muchos usuarios de las redes sociales tienen selfies a los que cualquiera puede acceder.
Eso es exactamente lo que permite la aplicación de código abierto Deep-Live-Cam, que ha alcanzado el número uno en descargas en GitHub y se ha vuelto viral en redes sociales como X (Twitter) y TikTok. Los peligros de los deepfakes tampoco son nuevos. En febrero, escribimos sobre un presunto robo en Hong Kong en el que alguien se hizo pasar por el director financiero de la empresa en una videollamada y robó más de 25 millones de dólares.
Los deepfakes han dado lugar a otros esquemas de extorsión y fraude financiero. Podemos esperar un aumento en los casos de fraude de video remoto gracias a la disponibilidad de software deepfake en tiempo real, y es posible que no involucre solo a celebridades o políticos.
Con el software de reemplazo de rostro, alguien puede tomarse una foto de las redes sociales y hacerse pasar por alguien que no está completamente familiarizado con tu apariencia y comportamiento, debido a la necesidad actual de imitar gestos, voz, decir, tu cabello, ropa y forma del cuerpo son similares. . .
También existen métodos para clonar estos aspectos de la apariencia y la voz (mediante clonación de voz y síntesis de IA entre imágenes), pero aún no se han desarrollado implementaciones ópticas, confiables y en tiempo real. Sin embargo, con el tiempo, es probable que esta tecnología sea asequible y fácil de usar. Se han dado casos de utilización de este tipo de programas informáticos con fines delictivos.
Por ejemplo, en febrero pasado, un actor se hizo pasar por el director financiero de una empresa en Hong Kong durante una videollamada y robó más de 25 millones de dólares, informó Ars Technica. Sin embargo, esta tecnología nunca ha sido más accesible que hoy.
¿Cómo funciona Deep-Live-Cam AI?
Su mecanismo no podría ser más sencillo. Después de descargar la aplicación, simplemente selecciona un retrato de la persona que deseas personificar. Luego se enciende la cámara de la computadora y listo. El intercambio de rostros en tiempo real se realiza mediante un modelo de inteligencia artificial llamado Inswapper.
Por supuesto, como puedes ver en las imágenes generales, esto es bastante preciso. Expertos en la materia explican que gracias a proyectos como Deep-Live-Cam, cada vez es más fácil utilizar esta tecnología en casa utilizando un ordenador normal y software gratuito. Como muchos proyectos de código abierto de GitHub, Deep-Live-Cam AIcombina varios paquetes de software existentes en una nueva interfaz.
Primero, detecta rostros tanto en la imagen de origen como en la de destino (como cuadros de video en vivo). Primero, detecta rostros tanto en la imagen de origen como en la de destino (como cuadros de video en vivo). Luego utiliza un modelo de IA previamente entrenado llamado “inswapper” para realizar reemplazos de rostros realistas.
Además, otro modelo llamado GFPGAN para mejorar la calidad de los rostros reemplazados al mejorar los detalles y corregir los artefactos que ocurren durante el reemplazo de rostros. El modelo inswapper de InsightFace puede adivinar cómo es una persona (en la foto proporcionada) usando diferentes expresiones y desde diferentes ángulos porque el modelo está entrenado en un enorme conjunto de datos.
Está entrenado con millones de rostros
El gigante contiene millones de imágenes faciales de miles de personas. Filmado desde muchos ángulos diferentes, con diferente iluminación y diferentes expresiones faciales. Mediante entrenamiento, la red neuronal subyacente al modelo de Inswapper le permite «comprender» las estructuras faciales y su dinámica en una variedad de condiciones.
También se incluye la capacidad de inferir la estructura facial en tres dimensiones a partir de imágenes 2D. También es posible separar los rasgos de identidad, que son constantes en diferentes imágenes de la misma persona, de los rasgos de pose, que varían según la perspectiva y la expresión facial.
Esta separación permite al modelo crear nuevas imágenes faciales que combinan la personalidad de un rostro con la pose, expresión e iluminación del otro. Deep-Live-Cam AI no es el único proyecto de software que cambia la cara. Otro proyecto de GitHub llamado facefusion utiliza el mismo modelo de IA de intercambio de caras pero con una interfaz diferente.
La mayoría de ellos dependen en gran medida de las redes anidadas de Python y de las bibliotecas de aprendizaje profundo como PyTorch, por lo que instalar Deep-Live-Cam AI aún no es tan fácil como hacerlo con un solo clic. Sin embargo, con el tiempo, la implementación de este tipo de función de intercambio de caras probablemente será más fácil y su calidad probablemente mejorará a medida que copie y desarrolle el trabajo de desarrollo de la IA de código abierto de cada uno.