
ARTDEPARTMENT

Cuando se lanzaron DALL-E 2 y MidJourney, muchos ya nos quedamos con la boca abierta. Y, sin requisa, desde hace unos meses la procreación de imágenes mediante IA ha cogido una calidad técnica asombrosa: manos coherentes, objetos acertadamente proporcionados, inserción de tipografía precisas... Sin requisa, pegado a todos estos logros (o, quizá, a causa de ellos) ha aparecido todavía un engendro incómodo y omnipresente: el "aspecto de IA".
Este estilo característico —piel cerosa, fondos borrosos con exceso de efecto bokeh, colores brillantes, pero poco naturales y composiciones planas— es lo asaz reconocible como para delatar que una imagen fue creada por una IA. El resultado es que, aunque las imágenes sean técnicamente correctas, carecen de la autenticidad y complejidad estética que buscamos en el arte o la fotografía vivo.
No se manejo de un simple capricho visual: es una consecuencia directa de cómo se entrenan y evalúan los modelos de imágenes. Básicamente, los sistemas están aprendiendo a gestar imágenes correctas, no atractivas. Y eso deja una huella muy reconocible. Podemos resumir sus causas principales en cuatro puntos:
Los investigadores se han centrado en resolver problemas que se pueden comprobar fácilmente:
Para esto usan métricas muy técnicas como FID o CLIP Score, que valoran la precisión, pero no tienen en cuenta si la imagen se percibe como vivo o no. Así, aunque la foto sea "correcta", puede que tenga cierto brillo raro o una composición excesivamente rígida.

Ejemplos de 'Aspecto IA' proporcionados por los desarrolladores de Flux
Para separar las buenas imágenes de las malas durante el entrenamiento, los modelos usan 'evaluadores' automáticos como LAION-Aesthetics o Pickscore. El problema es que estos evaluadores tienen sus propios gustos, y casi siempre prefieren:
¿El resultado? Acaban entrenando a la IA para que repita siempre ese mismo tipo de imagen, aunque el legatario quiera poco diferente.
En la período de ajuste fino, se usan opiniones humanas para enfilar al maniquí. Pero si esas opiniones vienen de familia con gustos muy diferentes (por ejemplo, amantes de la fotografía de moda y fans de los dibujos minimalistas), el maniquí termina creando un estilo promedio (insustancial) que no emociona a nadie: es como pedirle a un asociación holgado que diseñe una portada y que todos tengan que estar de acuerdo: el resultado suele ser correcto… pero soso.
Algunos usuarios avanzados intentan huir del 'aspecto IA' con prompts larguísimos y muy detallados, o entrenando modelos pequeños para estilos concretos (LoRAs). Y esto funciona, sí… pero exige tiempo y conocimientos que la mayoría de familia no tiene. Así que la gran mayoría se queda con el estilo por defecto que trae el maniquí, y ahí vuelve a aparecer el temido 'aspecto IA'.
Krea y Black Forest Labs (la compañía creadora de FLUX) decidieron enfrentarse al aspecto de marras con una idea sencilla y clara: no intentar deleitar a todo el mundo. En vez de despabilarse un estilo genérico que sirva para cualquier cosa, crearon un maniquí con un alegría estético muy definido, lo que ellos llaman un "maniquí opinado".
Es como si en vez de pedirle a un chef que cocine "poco que guste a todos", le pides que cocine su plato destino: puede que no sea para todos los paladares, pero a quien le guste, le encantará.
El plan de Krea tiene tres pasos secreto:
Aquí aprende diferentes estilos (fotografía, pintura, ilustración…), diferentes tipos de principios (objetos, paisajes, personas, animales), e incluso ejemplos de "malas imágenes" (borrosas, deformadas, etc.). ¿Por qué enseñarle esto postrer? Porque así, luego, cuando le digas "evita fondos borrosos" o "no hagas piel de plástico", sabrá exactamente de qué hablas.
Aquí empieza el "entrenamiento con personalidad". Hay dos fases:

Foto vivo / Imagen generada por ChatGPT / Imagen generada por FLUX-Krea (por Drew Breunig)
Aquí está la secreto: Krea no mezcla mil gustos diferentes en el mismo entrenamiento. Si lo hiciera, el resultado sería un estilo aguado, sin fuerza. En vez de eso, se centra en un tipo de estética muy definida, casi como si fuera la "firma" de un fotógrafo.
Esto tiene una delantera enorme: incluso con prompts cortos o genéricos, el maniquí ya produce imágenes con ese toque particular, sin carestia de trucos, comandos complicados o retoques posteriores.
En breviario, el truco del maniquí FLUX.1-Krea es entrenar con todo para memorizar acertadamente, pero afinar con un alegría concreto para evitar el "aspecto IA" y dar a las imágenes carácter propio. El resultado es un maniquí que genera imágenes que se 'sienten' menos prediseñadas.
En pruebas comparativas, GPT-4.1 y FLUX.1-Krea recibieron las mismas descripciones detalladas. Los resultados fueron reveladores:
Así, la tendencia que ejemplifica Krea apunta en torno a una era de modelos de IA opinados: sistemas entrenados con una estética o identidad concreta, ya sea para un estudio de animación, una marca de moda o un fotógrafo.
Esto no solo aumentará la calidad visual, sino que devolverá a la IA generativa poco que había perdido: la complejidad creativa. Tal y como se prevé en el ámbito del texto y los chatbots, la especialización y la personalización serán claves para mejorar tareas cualitativas.
Vía | dbreunig.com
Imagen | Marcos Merino mediante IA
En Genbeta | "Es un montón de basura": el 'padrino de la IA' palabra claro sobre una técnica que están usando OpenAI y otras grandes del sector
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!