Guía de prompts de imagen IA: tips y estilos
La diferencia entre una imagen IA aburrida y una impresionante casi siempre está en el prompt. Esta guía desglosa cómo escribir prompts de imagen que te den control sobre sujeto, estilo, iluminación, composición y color, con ejemplos que puedes adaptar para DALL-E, Midjourney o Stable Diffusion.
Empieza por el sujeto
Todo prompt de imagen necesita un sujeto claro. Antes de pensar en estilo o estado de ánimo, define con exactitud qué debe aparecer en el encuadre. "Un gato" es un punto de partida. "Un gato atigrado sentado en el alféizar de una ventana, mirando la lluvia" es un prompt.
Sé específico con cantidad, posición y acción. Si quieres dos personas, di "dos personas". Si deben estar frente a frente, menciónalo. Los modelos de imagen IA interpretan tus palabras de forma literal y rellenan con decisiones aleatorias todo lo que dejas sin especificar. La guía de DALL-E de OpenAI subraya que los prompts descriptivos y detallados producen resultados más predecibles.
Estructura la descripción del sujeto de lo general a lo específico. Empieza con la categoría amplia (persona, animal, objeto, paisaje), después agrega detalles definitorios (edad, raza, material, estación). Termina con la acción o estado (corriendo, derritiéndose, entreabierto). Este orden ayuda al modelo a construir una imagen mental coherente antes de añadir detalles finos.
Evita sobrecargar un solo prompt con demasiados sujetos. Dos o tres elementos en una escena funcionan bien. Cinco o más puntos focales suelen resultar en una imagen desordenada e incoherente. Si tu escena es compleja, considera generar elementos por separado y componer después.
Estilo y dirección artística
El estilo es lo que transforma tu prompt de "una foto de algo" a algo con identidad visual. Puedes referenciar movimientos artísticos (Art Nouveau, Bauhaus, ukiyo-e), tipos de medio (pintura al óleo, acuarela, fotografía analógica 35mm, pixel art) o cualidades visuales específicas (ilustración plana, hiperrealista, 3D low-poly).
Combinar dos o tres referencias de estilo suele producir resultados más interesantes que una sola. "Ilustración en acuarela con contornos de tinta al estilo de guías botánicas de campo" le da al modelo una dirección clara y más distintiva que simplemente "acuarela". La documentación de Midjourney muestra cómo apilar descriptores de estilo crea resultados con más capas y matices.
El medio importa tanto como el estilo. Especificar "pintura digital" da una textura distinta a "acrílico sobre lienzo", incluso con el mismo sujeto. Piensa en lo que le dirías a un artista humano: la herramienta que debería usar, la superficie sobre la que trabajar y la época que debería referenciar.
Cuando quieras fotorrealismo, agrega detalles técnicos de cámara: "fotografía con Canon EOS R5, lente 85mm f/1.4, profundidad de campo reducida." Estos términos activan los datos de entrenamiento del modelo provenientes de fotografía real. Los resultados se ven notablemente más como fotos reales que con un prompt genérico de "foto realista".
Iluminación y atmósfera
La iluminación lo cambia todo en una imagen. El mismo sujeto bajo la luz dorada del atardecer se siente cálido y esperanzador. Bajo una luz fluorescente dura, se siente clínico o inquietante. Necesitas especificar la iluminación porque el valor por defecto del modelo suele ser una luz plana y uniforme sin ningún carácter particular.
Términos de iluminación útiles: hora dorada, hora azul, contraluz, luz de borde, iluminación Rembrandt, luz difusa de día nublado, resplandor neón, luz de vela, luz volumétrica (rayos de dios) e iluminación de estudio de tres puntos. Cada uno produce un aspecto distinto. Combínalos con hora del día o condición meteorológica para más control: "iluminación de hora dorada con sombras largas en un camino polvoriento."
El estado de ánimo y la atmósfera van de la mano con la iluminación. Palabras como "sombrío", "etéreo", "crudo", "sereno" o "dramático" empujan la sensación general de la imagen.
Estos términos son imprecisos por sí solos, pero funcionan bien como modificadores junto a configuraciones de luz específicas. "Iluminación Rembrandt dramática en un callejón con niebla" es mucho más efectivo que "ambiente dramático".
La documentación de Stable Diffusion señala que las palabras clave de iluminación y atmósfera son de los tokens más influyentes en la generación de imágenes. Colocarlas al principio de tu prompt, justo después del sujeto, les da más peso.
Composición y encuadre
La composición le dice al modelo cómo distribuir los elementos dentro del encuadre. Sin indicaciones, obtendrás un plano medio centrado por defecto. Eso está bien para retratos de cabeza, pero limita cualquier otra cosa.
Usa términos de fotografía y cinematografía para dirigir el encuadre: primerísimo primer plano, primer plano, plano medio, plano entero, plano general, vista cenital, vista nadir, plano por encima del hombro, ángulo holandés. Cada uno crea una relación diferente entre el espectador y el sujeto.
Una vista nadir de un rascacielos lo hace sentir imponente. Una vista cenital del mismo edificio lo hace parecer una maqueta.
Las reglas de composición fotográfica se traducen bien a los prompts. Menciona "regla de tercios" para descentrar al sujeto. Usa "líneas guía" para dirigir la mirada hacia un punto focal. "Espacio negativo a la izquierda" te deja sitio para superponer texto en proyectos de diseño.
La relación de aspecto también afecta la composición. Un paisaje 16:9 se presta naturalmente a escenas ambientales, mientras que un vertical 9:16 funciona para retratos y contenido para móvil.
La documentación de Midjourney permite configurar la relación de aspecto directamente con el parámetro --ar, y otras herramientas tienen controles similares. Configura siempre la relación de aspecto antes de generar, no después, porque recortar una imagen cuadrada a formato panorámico desperdicia la mayor parte de la composición.
Color y textura
La paleta de colores establece el tono de una imagen antes de que el espectador procese el sujeto. Puedes guiar el color de varias formas: nombrar colores específicos ("verde azulado y naranja quemado"), referenciar un tipo de paleta ("tonos tierra apagados", "paleta pastel", "azul monocromático") o apuntar a una referencia cultural o de época ("colores Kodachrome de los 70", "neón cyberpunk").
La textura agrega calidad táctil que hace que las imágenes se sientan reales o deliberadamente estilizadas. "Pinceladas gruesas" se siente diferente a "gradientes suaves de aerógrafo". "Grano de película analógica" se siente diferente a "render digital limpio". Piensa en lo que sentirías si pudieras tocar la imagen y ponlo en palabras.
Combinar color y textura crea una firma visual. "Verde azulado y ámbar desaturados con grano de película visible y fugas de luz" es una estética específica que el modelo puede reproducir de forma consistente en múltiples generaciones. Esto es útil cuando necesitas una serie de imágenes que parezcan pertenecer al mismo conjunto, por ejemplo en una campaña de marca o un feed de redes sociales.
Si el modelo sigue produciendo resultados sobresaturados (un defecto común), agrega "colores apagados" o "baja saturación" a tu prompt. Por el contrario, si las imágenes se ven planas, prueba "vibrante", "alto contraste" o "colores ricos". Pequeños ajustes de color suelen tener un impacto mayor en la calidad percibida que cambios en el propio sujeto.
Prompts negativos (cuando están disponibles)
Los prompts negativos te permiten decirle al modelo qué excluir de la imagen. No todas las herramientas los soportan. Stable Diffusion tiene un campo dedicado para prompts negativos. Midjourney usa el parámetro --no. DALL-E maneja las exclusiones de forma menos directa, generalmente a través de la redacción cuidadosa del prompt principal.
Entradas comunes en prompts negativos incluyen: "borroso, baja calidad, manos deformadas, dedos extra, marca de agua, texto, recortado, fuera de encuadre." Estas atacan los artefactos más frecuentes en imágenes generadas por IA. Las manos y los dedos siguen siendo un punto débil para la mayoría de modelos, y mencionar deformidades explícitamente en el prompt negativo ayuda, aunque no elimina el problema por completo.
Piensa en los prompts negativos como barandillas, no como herramientas creativas. Funcionan mejor para suprimir problemas conocidos que para dirigir la dirección creativa. Decirle al modelo lo que sí quieres siempre es más efectivo que intentar esculpir la imagen listando todo lo que no quieres.
Un flujo de trabajo práctico: genera tu primera imagen sin prompts negativos. Anota los problemas específicos. Agrégalos al prompt negativo y regenera. Este enfoque dirigido funciona mejor que arrancar con una lista genérica larga de prompts negativos, porque estás resolviendo problemas reales en lugar de adivinar los hipotéticos.