Guia de prompts de imagem IA: dicas e estilos
A diferença entre uma imagem de IA sem graça e uma impressionante quase sempre está no prompt. Este guia explica como escrever prompts de imagem que dão controle sobre assunto, estilo, iluminação, composição e cor, com exemplos que você pode adaptar para DALL-E, Midjourney ou Stable Diffusion.
Comece pelo assunto
Todo prompt de imagem precisa de um assunto claro. Antes de pensar em estilo ou clima, defina exatamente o que deve aparecer no enquadramento. "Um gato" é um ponto de partida. "Um gato malhado sentado no parapeito de uma janela, olhando a chuva" é um prompt.
Seja específico com quantidade, posição e ação. Se você quer duas pessoas, diga "duas pessoas". Se elas devem estar de frente uma para a outra, diga isso.
Modelos de imagem IA interpretam suas palavras de forma literal e preenchem com escolhas aleatórias tudo que você deixar sem especificar. O guia de DALL-E da OpenAI destaca que prompts descritivos e detalhados produzem resultados mais previsíveis.
Estruture a descrição do assunto do geral para o específico. Comece pela categoria ampla (pessoa, animal, objeto, paisagem), depois adicione detalhes definidores (idade, raça, material, estação). Termine com a ação ou estado (correndo, derretendo, entreaberto). Essa ordem ajuda o modelo a construir uma imagem mental coerente antes de acrescentar detalhes finos.
Evite sobrecarregar um único prompt com assuntos demais. Dois ou três elementos em uma cena funcionam bem. Cinco ou mais pontos focais geralmente resultam em uma imagem confusa e sem coerência. Se a cena é complexa, considere gerar elementos separados e combinar depois.
Estilo e direção artística
Estilo é o que transforma seu prompt de "uma foto de uma coisa" em algo com identidade visual. Você pode referenciar movimentos artísticos (Art Nouveau, Bauhaus, ukiyo-e), tipos de mídia (pintura a óleo, aquarela, fotografia 35mm, pixel art) ou qualidades visuais específicas (ilustração flat, hiperrealista, 3D low-poly).
Combinar duas ou três referências de estilo costuma gerar resultados mais interessantes do que uma só. "Ilustração em aquarela com contornos a nanquim no estilo de guias botânicos de campo" dá ao modelo uma direção clara e mais distinta do que apenas "aquarela". A documentação do Midjourney mostra como empilhar descritores de estilo cria resultados com mais camadas e nuance.
O meio importa tanto quanto o estilo. Especificar "pintura digital" gera uma textura diferente de "acrílica sobre tela", mesmo com o mesmo assunto. Pense no que você diria a um artista humano: a ferramenta que ele deveria usar, a superfície, a época que deveria referenciar.
Quando quiser fotorrealismo, adicione detalhes técnicos de câmera: "foto com Canon EOS R5, lente 85mm f/1.4, profundidade de campo rasa." Esses termos ativam os dados de treinamento do modelo vindos de fotografia real. Os resultados ficam visivelmente mais parecidos com fotos de verdade do que um prompt genérico de "foto realista".
Iluminação e atmosfera
A iluminação muda tudo em uma imagem. O mesmo assunto sob a luz dourada do pôr do sol transmite calor e esperança. Sob luz fluorescente fria, parece clínico ou inquietante. Você precisa especificar a iluminação porque o padrão do modelo costuma ser uma luz plana e uniforme, sem caráter.
Termos de iluminação úteis: hora dourada, hora azul, contraluz, luz de contorno, iluminação Rembrandt, luz difusa de dia nublado, brilho neon, luz de vela, luz volumétrica (raios de sol) e iluminação de estúdio três pontos. Cada um produz um visual distinto. Combine com hora do dia ou condição climática para mais controle: "iluminação de hora dourada com sombras longas em uma estrada de terra."
Clima e atmosfera andam juntos com iluminação. Palavras como "sombrio", "etéreo", "gritty", "sereno" ou "dramático" empurram a sensação geral da imagem. Esses termos são imprecisos sozinhos, mas funcionam bem como modificadores de configurações de luz específicas. "Iluminação Rembrandt dramática em um beco com neblina" é muito mais eficaz que "clima dramático".
A documentação do Stable Diffusion aponta que palavras-chave de iluminação e atmosfera estão entre os tokens mais influentes na geração de imagens. Colocá-las no início do prompt, logo depois do assunto, dá mais peso a elas.
Composição e enquadramento
Composição diz ao modelo como organizar os elementos dentro do quadro. Sem orientação, você vai receber um plano médio centralizado por padrão. Funciona para fotos de rosto, mas limita qualquer outra coisa.
Use termos de fotografia e cinema para dirigir o enquadramento: close-up extremo, close-up, plano médio, plano inteiro, plano geral, vista aérea, contra-plongée, over-the-shoulder, ângulo holandês. Cada um cria uma relação diferente entre o espectador e o assunto. Uma contra-plongée de um arranha-céu faz ele parecer imponente. Uma vista aérea do mesmo prédio faz parecer uma maquete.
Regras de composição fotográfica se traduzem bem em prompts. Mencione "regra dos terços" para deslocar o assunto do centro. Use "linhas guia" para conduzir o olhar a um ponto focal. "Espaço negativo à esquerda" deixa espaço para texto em projetos de design.
A proporção de tela também afeta a composição. Um paisagem 16:9 se presta naturalmente a cenas ambientais, enquanto um vertical 9:16 funciona para retratos e conteúdo mobile.
A documentação do Midjourney permite definir a proporção diretamente com o parâmetro --ar, e outras ferramentas têm controles similares. Defina sempre a proporção antes de gerar, não depois, porque cortar uma imagem quadrada para formato panorâmico desperdiça a maior parte da composição.
Cor e textura
A paleta de cores define o tom de uma imagem antes mesmo de o espectador processar o assunto. Você pode guiar a cor de várias formas: nomear cores específicas ("azul-petróleo e laranja queimado"), referenciar um tipo de paleta ("tons terrosos suaves", "paleta pastel", "azul monocromático") ou apontar para uma referência cultural ou de época ("cores Kodachrome dos anos 70", "neon cyberpunk").
Textura adiciona qualidade tátil que faz imagens parecerem reais ou intencionalmente estilizadas. "Pinceladas grossas" transmite algo diferente de "gradientes suaves de aerógrafo". "Granulação de filme analógico" é diferente de "render digital limpo". Pense no que você sentiria ao tocar a imagem e coloque isso em palavras.
Combinar cor e textura cria uma assinatura visual. "Azul-petróleo e âmbar dessaturados com granulação de filme visível e vazamentos de luz" é uma estética específica que o modelo consegue reproduzir de forma consistente em várias gerações. Útil quando você precisa de uma série de imagens com visual coeso, por exemplo em uma campanha de marca ou feed de redes sociais.
Se o modelo insiste em produzir resultados saturados demais (um padrão comum), adicione "cores suaves" ou "baixa saturação" ao prompt. Por outro lado, se as imagens ficam chapadas, tente "vibrante", "alto contraste" ou "cores ricas". Pequenos ajustes de cor costumam impactar mais na qualidade percebida do que mudanças no assunto.
Prompt negativo (quando disponível)
Prompt negativo permite dizer ao modelo o que excluir da imagem. Nem todas as ferramentas suportam. O Stable Diffusion tem um campo dedicado para prompt negativo. O Midjourney usa o parâmetro --no. O DALL-E lida com exclusões de forma menos direta, geralmente pela redação cuidadosa do prompt principal.
Entradas comuns em prompts negativos incluem: "desfocado, baixa qualidade, mãos deformadas, dedos extras, marca d'água, texto, cortado, fora do enquadramento." Essas combatem os artefatos mais frequentes em imagens geradas por IA. Mãos e dedos continuam sendo um ponto fraco da maioria dos modelos, e mencionar deformidades no prompt negativo ajuda, embora não elimine o problema por completo.
Pense em prompts negativos como grades de proteção, não como ferramentas criativas. Funcionam melhor para suprimir problemas conhecidos do que para direcionar a criação. Dizer ao modelo o que você quer sempre é mais eficaz do que tentar esculpir a imagem listando tudo que não quer.
Um fluxo de trabalho prático: gere a primeira imagem sem prompts negativos. Anote os problemas específicos. Adicione-os ao prompt negativo e gere de novo. Essa abordagem direcionada funciona melhor do que começar com uma lista genérica longa, porque você está resolvendo problemas reais em vez de adivinhar os hipotéticos.