así evita el nuevo modelo de Flux el 'look creado-con-IA'

Publicado el

agosto 10, 2025

Notice: La función wp_get_loading_optimization_attributes ha sido llamada de forma incorrecta. Una imagen no debería ser diferida y marcada como alta prioridad al mismo tiempo. Por favor, ve depuración en WordPress para más información. (Este mensaje fue añadido en la versión 6.3.0). in /home/artdepartment.com.ar/public_html/wp-includes/functions.php on line 6131

Notice: La función wp_get_loading_optimization_attributes ha sido llamada de forma incorrecta. Una imagen no debería ser diferida y marcada como alta prioridad al mismo tiempo. Por favor, ve depuración en WordPress para más información. (Este mensaje fue añadido en la versión 6.3.0). in /home/artdepartment.com.ar/public_html/wp-includes/functions.php on line 6131

Cuando se lanzaron DALL-E 2 y MidJourney, muchos ya nos quedamos con la boca abierta. Y, sin requisa, desde hace unos meses la procreación de imágenes mediante IA ha cogido una calidad técnica asombrosa: manos coherentes, objetos acertadamente proporcionados, inserción de tipografía precisas... Sin requisa, pegado a todos estos logros (o, quizá, a causa de ellos) ha aparecido todavía un engendro incómodo y omnipresente: el "aspecto de IA".

Este estilo característico —piel cerosa, fondos borrosos con exceso de efecto bokeh, colores brillantes, pero poco naturales y composiciones planas— es lo asaz reconocible como para delatar que una imagen fue creada por una IA. El resultado es que, aunque las imágenes sean técnicamente correctas, carecen de la autenticidad y complejidad estética que buscamos en el arte o la fotografía vivo.

¿Qué provoca el "aspecto IA"?

No se manejo de un simple capricho visual: es una consecuencia directa de cómo se entrenan y evalúan los modelos de imágenes. Básicamente, los sistemas están aprendiendo a gestar imágenes correctas, no atractivas. Y eso deja una huella muy reconocible. Podemos resumir sus causas principales en cuatro puntos:

1. Excesiva obsesión con lo medible

Los investigadores se han centrado en resolver problemas que se pueden comprobar fácilmente:

Que las manos tengan 5 dedos.
Que el texto en la imagen sea fácil.
Que aparezca encajado lo que se pidió en el prompt, en el ocasión y cantidad correctos.

Para esto usan métricas muy técnicas como FID o CLIP Score, que valoran la precisión, pero no tienen en cuenta si la imagen se percibe como vivo o no. Así, aunque la foto sea "correcta", puede que tenga cierto brillo raro o una composición excesivamente rígida.

Ejemplos de 'Aspecto IA' proporcionados por los desarrolladores de Flux

2. Filtros estéticos que imponen un mismo estilo

Para separar las buenas imágenes de las malas durante el entrenamiento, los modelos usan 'evaluadores' automáticos como LAION-Aesthetics o Pickscore. El problema es que estos evaluadores tienen sus propios gustos, y casi siempre prefieren:

Retratos de mujeres jóvenes.
Fondos asaz borrosos (el ya citado exageración del propósito 'bokeh').
Pieles perfectamente suaves, carentes de imperfecciones.
Escenas muy iluminadas y brillantes.

¿El resultado? Acaban entrenando a la IA para que repita siempre ese mismo tipo de imagen, aunque el legatario quiera poco diferente.

3. Mezclar estilos hasta hacer un puré

En la período de ajuste fino, se usan opiniones humanas para enfilar al maniquí. Pero si esas opiniones vienen de familia con gustos muy diferentes (por ejemplo, amantes de la fotografía de moda y fans de los dibujos minimalistas), el maniquí termina creando un estilo promedio (insustancial) que no emociona a nadie: es como pedirle a un asociación holgado que diseñe una portada y que todos tengan que estar de acuerdo: el resultado suele ser correcto… pero soso.

4. Parchear el problema no siempre funciona

Algunos usuarios avanzados intentan huir del 'aspecto IA' con prompts larguísimos y muy detallados, o entrenando modelos pequeños para estilos concretos (LoRAs). Y esto funciona, sí… pero exige tiempo y conocimientos que la mayoría de familia no tiene. Así que la gran mayoría se queda con el estilo por defecto que trae el maniquí, y ahí vuelve a aparecer el temido 'aspecto IA'.

El enfoque de FLUX.1-Krea: llegan los modelos "opinados"

Krea y Black Forest Labs (la compañía creadora de FLUX) decidieron enfrentarse al aspecto de marras con una idea sencilla y clara: no intentar deleitar a todo el mundo. En vez de despabilarse un estilo genérico que sirva para cualquier cosa, crearon un maniquí con un alegría estético muy definido, lo que ellos llaman un "maniquí opinado".

Es como si en vez de pedirle a un chef que cocine "poco que guste a todos", le pides que cocine su plato destino: puede que no sea para todos los paladares, pero a quien le guste, le encantará.

El plan de Krea tiene tres pasos secreto:

1. Preentrenar para memorizar de todo

Aquí aprende diferentes estilos (fotografía, pintura, ilustración…), diferentes tipos de principios (objetos, paisajes, personas, animales), e incluso ejemplos de "malas imágenes" (borrosas, deformadas, etc.). ¿Por qué enseñarle esto postrer? Porque así, luego, cuando le digas "evita fondos borrosos" o "no hagas piel de plástico", sabrá exactamente de qué hablas.

Resolviendo el talón de Aquiles de las inteligencias artificiales: por qué no saben dibujar manos humanas

2. Postentrenar para afinar el alegría

Aquí empieza el "entrenamiento con personalidad". Hay dos fases:

Supervised Finetuning (SFT): Se le dan solo imágenes de altísima calidad que encajan con el estilo que averiguación Krea. Muchas son fotos reales, otras son imágenes generadas por versiones anteriores del maniquí. Es como decirle: "Esto es lo que queremos, fíjate acertadamente en cada detalle".
RLHF (Reinforcement Learning from Human Feedback): Personas expertas revisan pares de imágenes y eligen cuál encaja mejor con la estética buscada. El maniquí se va ajustando en función de esas elecciones, como si un profesor corrigiera su trabajo una y otra vez hasta que pille el estilo.

Foto vivo / Imagen generada por ChatGPT / Imagen generada por FLUX-Krea (por Drew Breunig)

3. Emplazar por un estilo claro y no mezclarlo con otros

Aquí está la secreto: Krea no mezcla mil gustos diferentes en el mismo entrenamiento. Si lo hiciera, el resultado sería un estilo aguado, sin fuerza. En vez de eso, se centra en un tipo de estética muy definida, casi como si fuera la "firma" de un fotógrafo.

Esto tiene una delantera enorme: incluso con prompts cortos o genéricos, el maniquí ya produce imágenes con ese toque particular, sin carestia de trucos, comandos complicados o retoques posteriores.

En breviario, el truco del maniquí FLUX.1-Krea es entrenar con todo para memorizar acertadamente, pero afinar con un alegría concreto para evitar el "aspecto IA" y dar a las imágenes carácter propio. El resultado es un maniquí que genera imágenes que se 'sienten' menos prediseñadas.

Comparando con GPT-4.1

En pruebas comparativas, GPT-4.1 y FLUX.1-Krea recibieron las mismas descripciones detalladas. Los resultados fueron reveladores:

GPT-4.1 producía imágenes “correctas” pero con el brillo, suavidad y bokeh del "aspecto IA".
FLUX.1-Krea, en cambio, generaba retratos más naturales, escenas urbanas más creíbles y composiciones con sensación de instantánea vivo.

Así, la tendencia que ejemplifica Krea apunta en torno a una era de modelos de IA opinados: sistemas entrenados con una estética o identidad concreta, ya sea para un estudio de animación, una marca de moda o un fotógrafo.

Esto no solo aumentará la calidad visual, sino que devolverá a la IA generativa poco que había perdido: la complejidad creativa. Tal y como se prevé en el ámbito del texto y los chatbots, la especialización y la personalización serán claves para mejorar tareas cualitativas.

Vía | dbreunig.com

Imagen | Marcos Merino mediante IA

En Genbeta | "Es un montón de basura": el 'padrino de la IA' palabra claro sobre una técnica que están usando OpenAI y otras grandes del sector

Source link

Compartir este artículo

[social_warfare]

Consultoria Personalizada

¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!

Enviar Consulta Gratis

Más para leer

Los grandes líderes tecnológicos ya no niegan que la burbuja de la IA pueda ser real. En vez de pincharla, piden ayuda

Gemini 3 Pro: La Nueva Era Agéntica de Google DeepMind

la mayor exposición de datos de la historia

En ARTDEPARTMENT nos especializamos en brindar soluciones para que tu negocio, empresa o proyecto sea visible en internet.

así evita el nuevo modelo de Flux el 'look creado-con-IA'