Há uma série de ferramentas de IA para conversão de texto em vídeo e, embora a tecnologia seja realmente impressionante, sempre há algo no resultado final que parece estranho. Demorou um pouco para identificar o problema, mas no final tudo se resumiu a uma coisa: o efeito do vale misterioso.
Embora você possa usar algumas ferramentas com tecnologia de IA para criar efeitos visuais em seus projetos de vídeo, não é recomendado usar IA sozinha para criar filmagens porque parece muito estranho.
O maior problema com ferramentas de texto para vídeo de IA
A geração de vídeos por IA evoluiu muito em um curto período de tempo graças aos avanços no Deep Learning. Em 2023, quando a geração de vídeos com IA explodir, você pode se lembrar deste clipe de Will Smith comendo espaguete se tornando viral. Embora esse tipo de tecnologia fosse inovador na época, não há como negar o quão artificial e desconfortável ela parecia.
Em 2024, essas ferramentas de modelagem de vídeo de IA estão melhorando, criando imagens mais suaves e movimentos mais realistas. Veja a diferença entre os vídeos criados com o Runway Gen-2 em 2023 e os vídeos lançados pela OpenAI em 2024 para mostrar o Sora AI. Sora ainda não está disponível para uso público, mas a qualidade parece promissora:
Embora melhorados, os resultados ainda são inconclusivos. Primeiro, Sora ainda não está disponível para uso, então ainda estamos presos a geradores menos sofisticados que podem produzir resultados assustadores como o vídeo de espaguete de Will Smith.
Basta assistir ao vídeo criado com o PixVerse usando o prompt "Uma pessoa caminhando por um parque em um dia ensolarado, sorrindo e acenando para a câmera. Pássaros voam no céu e árvores balançam suavemente ao vento" . (Tradução aproximada: "Uma pessoa caminha por um parque em um dia ensolarado, sorrindo e acenando para a câmera. Pássaros voam acima e as árvores balançam suavemente ao vento").
Os primeiros dois segundos parecem bons, até que os dedos, o cabelo e o rosto da pessoa começam a desaparecer no ar! Mesmo que ferramentas mais avançadas como o Sora surjam e nos forneçam vídeos mais precisos e bonitos, ainda há algo perturbador sobre pessoas e paisagens geradas por IA.
Enquanto modelos mais antigos frequentemente produziam vídeos que mostravam claramente a IA, como imagens no estilo claymation, as melhorias das ferramentas mais novas parecem quase perfeitas demais.
Não natural, desconfortável e sem vida. Esse é exatamente o efeito do vale misterioso — semelhante ao humano, mas não exatamente.
Não importa quão boas sejam essas ferramentas, o efeito do vale misterioso sempre existe. A menos que você esteja buscando um estilo abstrato e surreal visto apenas em sonhos, você não deve confiar em ferramentas de texto para vídeo de IA para nenhum dos seus projetos de vídeo.