Guía de prompts de imagen IA: estructura, estilo y control

GetBetterPrompts Editorial Team · Actualizado el 15 de julio de 2026

Esta guía enseña craft portable para prompts de imagen: objetivo creativo, sujeto, entorno, composición, perspectiva, acción, luz, color, material, estilo, restricciones, propósito de salida, referencias, iteración y verificación. No clasifica productos ni presenta la sintaxis de Midjourney, los campos de la API de OpenAI o los menús de Firefly como gramática universal. Las capacidades cambian por producto y versión; verifica siempre en la documentación actual de tu herramienta.

Qué cubre esta guía (y qué no)

Aquí encontrarás principios que viajan entre sistemas de imagen: OpenAI, Google Imagen/Gemini, Midjourney, Firefly, la línea Stable Diffusion y casos distintos como Flux. El objetivo es un brief visual controlable, no un ranking de modelos.

La sintaxis profunda por producto vive en otras guías: Guía de prompts para GPT Image y ChatGPT Images, Prompts de Midjourney y Nano Banana y Cómo hacer prompts en Gemini. Esta página no promete tipografía perfecta, manos impecables, fotorrealismo garantizado ni adherencia total al prompt.

Empieza por un objetivo creativo

Antes del sujeto, di para qué sirve la imagen: anuncio, miniatura, mockup de UI, foto de producto, concepto artístico o ilustración editorial. El uso previsto orienta el nivel de pulido y qué detalles importan.

Un brief débil: "haz una imagen chula de zapatillas". Un brief con propósito: "foto de catálogo e-commerce de zapatillas high-top blancas sobre fondo seamless gris claro, ángulo 3/4 frontal, lista para ficha de producto". El mismo sujeto cambia de look según el entregable.

Construye un sujeto controlable

Define quién o qué aparece, cuántos hay, rasgos distintivos y la acción o pose. Capas de lo general a lo específico: categoría amplia, detalles definitorios, acción o estado.

Débil:

realistic photo of a woman

Mejorado:

Photorealistic three-quarter portrait of a woman in her 30s with short silver hair, looking just past the camera, soft window light from camera-left, shallow background blur, neutral gray wall, calm editorial mood. No watermark, no extra text.

Por qué ofrece más control: identidad, mirada, dirección de luz, entorno, estilo y restricciones. Omite marcas de cámara; "shallow background blur" describe el look sin garantizar óptica real.

Cuidado con el desorden: dos o tres elementos focales suelen funcionar; cinco o más puntos compitiendo suelen saturar el encuadre. Lo que omites lo rellenan los valores por defecto del modelo y sus priors de entrenamiento, no "azar malicioso".

Coloca el sujeto en un entorno

Indica dónde ocurre la escena, la hora del día, el clima y solo los props que cargan significado. Un entorno vacío a propósito ("fondo seamless, sin props") es tan importante como un set rico.

Débil:

cyberpunk city

Mejorado:

Wide establishing view of a rainy near-future city street at night, neon signs reflecting on wet asphalt, one empty crosswalk in the foreground, dense midground traffic lights, towering glass buildings fading into fog, teal-and-magenta color grade, cinematic still.

Por qué ofrece más control: profundidad por planos, clima, grade de color y un ancla clara en primer plano en lugar de una sola palabra de género.

Compón el encuadre

Usa lenguaje de encuadre: primer plano, plano general, ángulo bajo, vista cenital, espacio negativo. Describe perspectiva y profundidad como look (primer plano / medio / fondo; desenfoque suave vs foco amplio), no como física garantizada de lente.

Di qué se lee primero en la jerarquía visual. El espacio negativo importa en diseño cuando dejas sitio para un titular.

La relación de aspecto y el tamaño suelen ser controles de UI o API, no adjetivos del prompt. En Midjourney puedes usar --ar; en otras herramientas elige el ratio en el selector o en la API. Configura el formato antes de generar: recortar un cuadrado a 16:9 después desperdicia composición.

Dirige luz, color y material

Prefiere fuente + calidad + dirección a buzzwords sueltos. "Luz de ventana suave desde la izquierda de cámara, sombra de contacto suave" controla más que "iluminación dramática" solo.

Nombra paletas concretas ("teal y magenta", "tonos tierra apagados") y materiales táctiles (cuero, cerámica mate, asfalto mojado). Evita apilar "8K", "ultra detailed" o "HDR" sin hechos visuales: suelen pesar menos que materiales, luz y medio concretos.

Si no especificas la luz, queda fuera de control; no asumas que el default es siempre "plano y sin mood" en todos los productos.

Elige un estilo coherente

Combina medio + movimiento + cualidades visuales en un sistema coherente. "Ilustración en acuarela botánica con contornos de tinta" es más claro que apilar cinco estilos que pelean.

Débil:

watercolor flowers

Mejorado:

Botanical watercolor illustration of a single poppy with ink outlines on textured cold-press paper, soft pigment blooms, generous white negative space on the right for a caption, field-guide plate aesthetic, muted greens and coral red.

Por qué ofrece más control: medio, técnica, propósito de composición (espacio para pie) y paleta. Apila estilos solo cuando el híbrido sea deliberado.

El lenguaje de cámara (plano, "telephoto look", desenfoque de fondo) puede orientar look fotorrealista y encuadre. No promete la óptica de una marca o lente concretas; las especificaciones detalladas pueden interpretarse de forma flexible.

Pon controles fuera de la prosa

Aspecto/tamaño, calidad, seed, presets de estilo y muchos exclusores viven en la UI o la API. Cuando tu herramienta ofrece el control, úsalo en lugar de enterrar la misma idea solo en el texto del prompt.

Ratio / tamaño: selector o API (size, aspectRatio, --ar en Midjourney como ejemplo, no como regla universal).
Calidad / steps / CFG: ajustes de producto; la latencia frente a la fidelidad no se arregla solo con adjetivos.
Seed: herramienta de reproducibilidad del producto, no prosa portable.
Presets: úsalos cuando coincidan con la intención; si no, describe el medio en texto.

No pegues flags de Midjourney dentro de un prompt de Gemini como si se ejecutaran.

Restricciones y exclusiones sin exagerar

Describe primero la escena deseada. Los prompts negativos no son universales: el soporte depende del modelo y de la interfaz.

Restricciones en el prompt (p. ej. GPT Image): "no watermark", "no extra text", listas de conservación.
Parámetro de exclusión (Midjourney): --no item1, item2.
Campo negativo (Imagen / línea SD): campo aparte; describe lo no deseado con claridad según la documentación del producto.
Relleno / borrado en UI (Firefly y similares): herramientas de edición, no negativos clásicos.
Sin negativos (p. ej. Flux): reescribe las exclusiones como descripción positiva de la escena.

Flujo práctico: genera una vez, anota defectos concretos, aplica el mecanismo correcto de tu herramienta, evita ban-lists genéricas enormes en el primer intento. Verifica en la documentación actual; no digas "todos los modelos permiten excluir".

Texto en imagen y tipografía

Pon el copy exacto entre comillas, mantén las cadenas cortas, indica colocación y carácter tipográfico (sans-serif negrita, etc.) e itera. No esperes documentos largos perfectos ni fuentes con nombre exacto.

Débil:

poster with text about summer

Mejorado:

Minimalist poster, solid sun-washed cream background, centered bold sans-serif title "SUMMERLAND", smaller subtitle underneath "Open late", large clean lettering, plenty of margin, no other text, no watermark.

Por qué ofrece más control: cadenas entrecomilladas, jerarquía, colocación y "no other text". Aun así, verifica el lettering visualmente.

Cuándo usar imágenes de referencia

Usa referencias cuando el look de marca, la identidad de personaje o la geometría de producto deben quedar bloqueados, cuando un estilo es más fácil de mostrar que de nombrar, o cuando la prosa se desvía del aesthetic deseado.

Débil: un párrafo largo intentando reinventar un look de marca de memoria.

Mejorado:

Image 1 is the product photo to keep. Image 2 is the style reference only. Keep the product geometry, label layout, and camera angle from Image 1. Apply Image 2's soft daylight, film grain, and muted pastel grade. Do not copy objects from Image 2.

Por qué ofrece más control: indexa referencias, asigna roles (identidad vs estilo) y declara no-objetivos. La sintaxis de adjuntos (--sref, IDs de API, etc.) vive en las guías de producto.

Editar frente a generar de cero

Generación nueva: brief completo (sujeto, escena, estilo, restricciones). Edición: di qué cambia y qué debe permanecer.

Débil:

make it better and more premium

Mejorado:

Edit only the background: replace the busy kitchen with a clean white quartz counter and soft daylight. Preserve the cereal box design, typography, camera angle, crop, and product proportions exactly. Do not change colors on the box. No new props, no logos, no watermark.

Por qué ofrece más control: lista quirúrgica de cambios + lista de conservación. Las máscaras y el generative fill pueden sangrar; la identidad puede derivar; verifica tras cada paso. No prometas drift casi nulo.

Itera y verifica

Cambia una variable por turno. Claridad y no contradicción ganan a la longitud: añade detalle solo para lo que debes controlar. Si el prompt es difícil de escanear, divídelo en segmentos cortos etiquetados.

Prioridad sugerida: propósito + sujeto + restricciones imprescindibles → entorno + acción → composición + luz → color/material/estilo → shorthand opcional de cámara → controles de herramienta.

Antes de generar, comprueba:

propósito declarado
sujeto, cantidad y acción inequívocos
solo props que cargan significado
un punto focal principal
encuadre / perspectiva descritos
luz con fuente + calidad + dirección si el mood importa
estilo/medio coherente
exclusiones con el mecanismo correcto de esta herramienta
aspecto/tamaño/calidad/seed/presets en controles cuando existan
texto en imagen entrecomillado, corto y con colocación
referencias adjuntas y con rol si hacen falta
sabes si es generación nueva o edición

Problemas frecuentes: sujeto equivocado o extras → aprieta cantidad/acción y vacíos positivos; look plano → añade luz, material y medio; sopa de estilos → un solo sistema; exclusión ignorada → el producto quizá no tenga negativos; texto ilegible → cadenas más cortas y fondo más simple; edición que deriva → change-only + invariantes; composición aplastada tras el crop → fija el ratio antes.

Portable Image Brief (PIB)

Esta guía usa el Portable Image Brief (PIB): un checklist práctico de 12 puntos creado para GetBetterPrompts. No es un estándar de la industria, ISO ni framework de un proveedor. Úsalo antes de generar:

Purpose - ¿Para qué es la imagen?
Subject - ¿Quién/qué, cuántos, rasgos?
Action - ¿Qué ocurre; mirada/pose si hay personas?
Environment - ¿Dónde; qué props son imprescindibles?
Composition - ¿Encuadre, altura/ángulo, qué se lee primero?
Perspective / depth - ¿Planos; look de foco superficial o amplio?
Lighting - ¿Fuente, calidad, dirección, hora?
Color + material - ¿Paleta; superficies que importan?
Style / medium - ¿Un sistema coherente?
Constraints - ¿Debe / no debe; qué mecanismo de exclusión admite esta herramienta?
Controls - ¿Aspecto/tamaño/calidad/seed/preset en UI/API?
Proof plan - ¿Hace falta referencia? ¿Editar o generar? ¿Qué comprobarás tras el primer render?

Por dónde seguir

Prueba y refina prompts en la herramienta gratuita de prompts de imagen.

Guía de prompts para GPT Image y ChatGPT Images - flujos específicos de OpenAI
Prompts de Midjourney y Nano Banana - parámetros MJ y patrones Nano Banana
Cómo hacer prompts en Gemini - mapa de productos Gemini

Las capacidades evolucionan. Trata los límites como clases de capacidad y vuelve a comprobar la documentación el día que publiques.

Fuentes

Genera prompts de imagen gratis

Guía de prompts de imagen IA: estructura, estilo y control

GetBetterPrompts Editorial Team · Actualizado el 15 de julio de 2026

Photorealistic three-quarter portrait of a woman in her 30s with short silver hair, looking just past the camera, soft window light from camera-left, shallow background blur, neutral gray wall, calm editorial mood. No watermark, no extra text.

Wide establishing view of a rainy near-future city street at night, neon signs reflecting on wet asphalt, one empty crosswalk in the foreground, dense midground traffic lights, towering glass buildings fading into fog, teal-and-magenta color grade, cinematic still.

Botanical watercolor illustration of a single poppy with ink outlines on textured cold-press paper, soft pigment blooms, generous white negative space on the right for a caption, field-guide plate aesthetic, muted greens and coral red.

Minimalist poster, solid sun-washed cream background, centered bold sans-serif title "SUMMERLAND", smaller subtitle underneath "Open late", large clean lettering, plenty of margin, no other text, no watermark.

Image 1 is the product photo to keep. Image 2 is the style reference only. Keep the product geometry, label layout, and camera angle from Image 1. Apply Image 2's soft daylight, film grain, and muted pastel grade. Do not copy objects from Image 2.

Edit only the background: replace the busy kitchen with a clean white quartz counter and soft daylight. Preserve the cereal box design, typography, camera angle, crop, and product proportions exactly. Do not change colors on the box. No new props, no logos, no watermark.