Início
» Wiki
»
Por que a IA não consegue escrever texto em imagens?
Por que a IA não consegue escrever texto em imagens?
Se você usou ferramentas de IA generativa para criar imagens, pode ter encontrado problemas ao escrever texto em imagens. Saber por que isso acontece ajudará a evitar esse problema, bem como encontrar maneiras de resolvê-lo.
Por que a IA não consegue escrever texto em imagens?
O maior motivo pelo qual a IA não consegue escrever texto é por causa de dados de entrada anteriores. Embora a IA seja muito boa na geração de imagens em geral, alguns aspectos, como texto, não foram usados no mesmo nível para treinar grandes modelos de linguagem (LLMs) . Portanto, a IA não é muito hábil em gerar texto em imagens.
Embora bastante avançadas, as ferramentas de IA ainda estão tecnicamente em estágios iniciais. Além disso, algumas ferramentas de IA estão ficando sem dados de treinamento. Ainda há uma chance de que ferramentas de geração possam gerar um texto melhor, mas, por enquanto, você terá que tentar uma alternativa.
Existe uma alternativa para texto ilegível em imagens de IA?
Embora gerar texto em imagens de IA seja bastante difícil, não é impossível. Aqui estão os métodos mais eficazes no momento...
1. Dê à ferramenta instruções mais específicas
Quando as pessoas começam a usar IA, suas habilidades de escrita de prompts geralmente são abaixo do padrão. O maior erro é dar instruções vagas como “crie uma imagem de uma cena de rua”.
Não é surpresa que você obtenha resultados abaixo da média. A melhor maneira de usar a IA Generativa é pensar no seu prompt como um briefing criativo. Quanto mais específico, melhor. Aqui está um exemplo de prompt:
Crie uma imagem do exterior de um café italiano. Quero que tenha a inscrição "Café" como placa e que seja em um dia ensolarado.
Tradução aproximada : Crie uma imagem externa de um café italiano. Quero que a imagem tenha as palavras "Café" na placa e em um dia ensolarado.
Como você pode ver na imagem abaixo, o ChatGPT se saiu muito bem. Isso não aconteceria se você simplesmente dissesse "Criar uma imagem externa de um café italiano".
Imagem de uma cafeteria criada em DALL-E
Na experiência pessoal, imagens simples parecem ser mais eficazes. Por exemplo, a imagem acima tem menos elementos do que a imagem testada abaixo — o que significa que a IA tem menos para tentar aprender.
Uma cena de rua ajustada no aplicativo DALL-E 3
2. Use variações da palavra "Texto"
Mudar um pouco o idioma do prompt pode fazer uma grande diferença. Depois de tentar o termo "texto" algumas vezes, você começará a sentir como se estivesse andando em círculos, então tente sinônimos diferentes.
Por exemplo, em vez de "texto", você pode tentar:
Título
Alfabeto
Palavra escrita
Símbolo
Se nenhuma dessas opções funcionar, continue tentando alternativas. O que funciona e o que não funciona pode variar dependendo do que você está tentando criar. Por exemplo, você provavelmente não usaria "símbolo" se estivesse tentando criar um cartão de aniversário. Experimentar diferentes ideias de prompts de IA é fundamental aqui, e diferentes ferramentas podem funcionar de maneiras diferentes.
3. Adicione texto usando as ferramentas de substituição
Você não deve adicionar texto por meio das ferramentas de substituição se as palavras devem fazer parte da imagem, mas é uma boa ideia se você estiver tentando criar mais gráficos. Funcionará se você quiser criar um cartão, um gráfico, uma capa de livro ou algo semelhante.
Se você for fazer isso, certifique-se de que haja espaço suficiente na imagem. Você pode usar qualquer ferramenta que desejar para adicionar texto à sua imagem. Canva ou Adobe Photoshop Express são opções recomendadas, mas outros aplicativos que permitem adicionar texto a imagens no seu smartphone também funcionam com conteúdo criado usando IA.
Você também deve se certificar de que o texto corresponde à imagem gerada pela IA. Use fontes que combinem com o clima que você está tentando transmitir e remodele as coisas como achar necessário.
4. Mantenha o texto curto
A geração de texto de imagem de IA falha frequentemente porque você tenta adicionar muito texto. Honestamente, isso acontece sempre que você tenta criar algo com mais de 10 caracteres. Semelhante à recomendação de manter as imagens simples, você deve fazer tudo o que puder para manter seu texto curto.
Para testar isso, o autor tentou outro prompt:
Por favor, gere uma imagem de um banco com o texto "banco" do lado de fora. Quero que seja em uma área central da cidade e com uma estrutura moderna, como o que você veria em uma cidade dos EUA.
Tradução aproximada : Faça uma imagem de um banco com a palavra "banco" do lado de fora. Eu queria que fosse no centro da cidade e tivesse uma estrutura moderna, como o que você veria em uma cidade americana.
Como você pode ver abaixo, o mecanismo de IA fez um bom trabalho ao ouvir o usuário. Entretanto, há alguns erros em uma parte da imagem. Então diga à IA que você só quer um ou dois sinais para limitar a chance de isso acontecer. Esses problemas também parecem ocorrer quando o texto é menor, então tenha isso em mente.
Imagem de edifício moderno criada em DALL-E
5. Use ferramentas para corrigir erros de texto
Semelhante a como você pode remover falhas em fotos tiradas com sua câmera, você pode tentar usar uma ferramenta que ajuda a corrigir erros de texto em fotos. Existem muitos aplicativos que corrigem erros em fotos geradas por IA, como o Storia Lab.
Erro da ferramenta Storia Lab AI Textify
Ao usar essas ferramentas, normalmente você pode selecionar texto e alterar o conteúdo conforme apropriado. Alguns aplicativos são gratuitos, mas em outros casos você precisará de uma assinatura paga. Se você criar muitas imagens com IA, poderá adquirir um plano mensal ou anual para acessá-las sempre que precisar.
6. Use ferramentas de IA para gerar texto preciso
Você já deve ter ouvido falar do Midjourney , DALL-E, Firefly e geradores de imagens de IA semelhantes. Mas você sabia que existem geradores de arte de IA específicos que geram textos precisos em imagens?
Como um dos recursos especiais do Ideogram é a criação de texto legível, você definitivamente pode experimentar este aplicativo para algumas de suas criações. O Ideogram tem um recurso Magic Prompt que estende seu recurso original, o que significa que você pode obter resultados ainda mais precisos. Além do plano gratuito, os planos de assinatura paga começam em US$ 8/mês.
Embora a IA tenha suas deficiências na criação de imagens com texto legível, você encontrará algumas alternativas se estiver disposto a pensar fora da caixa. Às vezes, a melhor opção é dar à sua ferramenta instruções detalhadas que sejam menos prolixas para processar. Você também pode querer corrigir problemas em suas imagens com outro software ou usar ferramentas projetadas especificamente para criar textos precisos.