Flux AI: Conoce el nuevo generador de imágenes de IA
| | |

Flux AI: Conoce el nuevo generador de imágenes de IA

Flux AI: Conoce el nuevo generador de imágenes de IA

La startup de inteligencia artificial Black Forest Labs anunció su lanzamiento corporativo y lanzó el primer conjunto de modelos de inteligencia artificial de texto a imagen, llamado Flux AI. La empresa alemana, fundada por los científicos que desarrollaron la tecnología Stable Diffusion e inventaron la técnica Stealth Diffusion, tiene como objetivo crear una inteligencia artificial innovadora y avanzada para fotografías y vídeos. ¡Sigue leyendo!

¿Qué es Flux AI?

¿Qué es Flux AI?

Empecemos desde el principio. Flux es un conjunto de modelos de conversión de texto a imagen de código abierto. Flux está entrenado en un enorme conjunto de datos, por lo que puede crear imágenes realistas basadas en descripciones en lenguaje natural. 

La fortaleza de Flux en el extremadamente competitivo mercado de la IA de generación de imágenes radica en su profundo conocimiento del lenguaje, lo que le permite comprender e interpretar las descripciones más complejas y convertirlas en composiciones detalladas y coherentes. 

Black Forest Labs ha lanzado tres modelos de conversión de texto a imagen de FLUX AI: una versión «profesional» comercial de gama alta. Una versión «para desarrolladores» de gama media con un peso abierto para uso no comercial y una versión más rápida con código abierto. Black Forest Labs afirma que sus modelos superan a las opciones existentes como Midjourney y DALL-E en áreas como calidad de imagen y alineación de texto.

El lanzamiento de FLUX AI se producirá aproximadamente siete semanas después de que Stability AI lanzará el problemático Stable Diffusion 3 Medium a mediados de junio. La propuesta de Stability AI ha enfrentado críticas generalizadas por parte de los fanáticos de la síntesis de imágenes por su pobre desempeño en la generación de la anatomía humana. También por los usuarios comparten ejemplos de extremidades y cuerpos distorsionados en las redes sociales.

A este problemático lanzamiento le siguió la partida anticipada de tres ingenieros clave en estabilidad de la IA: Robin Rombach, Andreas Blattmann y Dominik Lorenz, quienes más tarde fundaron Black Forest Labs con el co-inventor de la nave sigilosa Patrick Esser y otros.

¿Cómo funciona Flux AI?

Los dos modelos FLUX AI de alto rendimiento son en gran medida comparables al DALL-E 3 de OpenAI en términos de precisión instantánea y propiedades ópticas similares al Midjourney 6. Son una mejora significativa con respecto al Stable Diffusion XL, el último lanzamiento importante del equipo. en Estabilidad(). si SDXL Turbo no está incluido). 

Los modelos FLUX AI utilizan lo que la empresa llama una «arquitectura híbrida», que combina técnicas de difusión y transformación, que puede escalar a 12 mil millones de parámetros. Black Forest Labs dice que mejora los modelos de difusión anteriores mediante la adaptación del flujo y otras optimizaciones. 

Características de Flux AI

 

Características de Flux AI

AI parece ser capaz de reproducir muy bien las manos humanas, lo cual era un defecto de los modelos de síntesis de imágenes anteriores, como Steady Diffusion 1.5, debido a la falta de imágenes de entrenamiento con enfoque manual. Desde entonces, otros creadores de imágenes de IA como Midjourney también han dominado la mano. Pero, vale la pena señalar, que el modelo a escala abierta muestra la mano con relativa precisión en una variedad de posiciones. 

Pero esta startup no se limita a salir al mercado y anunciar «Estamos», sino que también deja claro que sus participantes llevan mucho tiempo trabajando en este Landing. De hecho, lanzaron su primer pack de modelos de generación de imágenes, que ha tenido un gran impacto en la comunidad tecnológica. 

  • FLUX AI [pro]: Esta es la versión más avanzada que ofrece el mejor rendimiento en generación de imágenes con instrucciones precisas, alta calidad de imagen y resultados diversos. Está disponible a través de API y en plataformas como Replikacja, Freepik y fal.ai, pero no se ofrece como modelo de código abierto. 
  • FLUX AI [dev]: Este modelo, destinado a uso no comercial, es una versión mejorada de FLUX AI [pro] que ofrece calidad similar y compatibilidad rápida con menos esfuerzo y más cálculo. Está disponible en HuggingFace para la comunidad de investigación y los entusiastas de la IA. 
  • FLUX AI [schnell]: Diseñado para desarrollo local y uso personal, este modelo es el más rápido de los tres y está disponible bajo la licencia Apache 2.0, que no permite uso comercial. Si bien el acceso a la versión Pro es limitado, las versiones 

Flux pretende desplazar a Midjourney

Con el anuncio del lanzamiento de Flux, el equipo de Black Forest Labs anunció sus planes futuros: un próximo conjunto de sistemas integrales de conversión de texto a video que prometen «desbloquear capacidades clave de creación y edición con alta resolución y velocidad sin precedentes». 

Comparación con sus competidores

Comparación con sus competidores

Desde su lanzamiento, los modelos FLUX.1 han sido muy apreciados por la comunidad de IA, especialmente por su capacidad para generar imágenes de alta calidad con instrucciones precisas (esto es especialmente notable en el caso de la necesidad visual de crear texto).

Este nuevo grupo de modelos ha revitalizado la escena de imágenes de código abierto, especialmente después de que modelos como Stable Diffusion 3 no cumplieron con las expectativas de la comunidad. La capacidad de los modelos FLUX.1 para admitir una variedad de estilos y su rendimiento en la generación de imágenes ha llevado a algunos expertos a considerarlos como una alternativa viable a Midjourney en aplicaciones de código abierto.

En comparación con otros modelos líderes como Midjourney v6.0 y DALL·E 3, FLUX.1 demostró un rendimiento excelente en áreas clave como variedad de estilos, complejidad de escenas y legibilidad del texto generado. 

Calidad de imagen

  • Flux: destaca por crear atmósferas realistas y precisas con un excelente uso de luces y sombras. Se especializa en crear imágenes surrealistas, equilibrando todos los elementos de la pista con detalle y precisión. 
  • Stable Diffusion (medio SD3): Produce imágenes atractivas, aunque existen algunas limitaciones en la presentación morfológica y en ocasiones no representa completamente el estilo fotográfico deseado. La integridad de la imagen puede verse afectada por ciertos detalles, como la posición de las personas y los objetos en la foto. 
  • MidJourney: Crea imágenes detalladas y vibrantes con mucho estilo, aunque a veces pierde precisión al seguir instrucciones exactas, especialmente al disparar de cuerpo entero o contra un fondo específico. 

Si bien MidJourney es conocido por su capacidad para interpretar señales de manera creativa (pero a menudo sacrifica el cumplimiento preciso por composiciones visualmente impresionantes), Flux se destaca por seguir instrucciones precisas, capturar todos los elementos deseados y ser consistente con un estilo y diseño definidos. Herramientas de colaboración

Mientras que SD y MidJourney se centran en creadores individuales, Flux proporciona herramientas de colaboración en equipo que permiten que varios usuarios trabajen en el mismo proyecto en tiempo real, ideal para equipos de proyectos que necesitan coordinarse.

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *