A gigante chinesa de comércio eletrônico Alibaba continua a ser manchete ao lançar um novo modelo de IA que, segundo ela, é capaz de ler emoções humanas. O modelo, chamado "R1-Omni", foi desenvolvido por uma equipe de engenheiros do Tongyi Lab do Alibaba. Com a leitura de emoções no centro da interação do usuário, a Alibaba afirma com confiança que o R1-Omni pode superar completamente concorrentes como o ChatGPT da OpenAI e muitos outros modelos de LLM atualmente no mercado em termos de experiência no mundo real.
Notavelmente, o R1-Omni é oferecido como código aberto. Em demonstrações, esse modelo de IA foi capaz de entender emoções humanas a partir de vídeos, além de descrever suas roupas e arredores. O novo modelo de IA do Alibaba leva a visão computacional para o próximo nível, com base em um modelo lançado anteriormente chamado HumanOmni, também criado pelo pesquisador Jiaxing Zhao e seus colegas do Tongyi Lab.
Tecnicamente, o R1-Omni pode ser considerado o primeiro modelo abrangente de linguagem multimodal que aplica aprendizado por reforço com recompensas verificáveis (RLVR) – uma tecnologia que promete aprimorar a capacidade da IA de raciocinar e analisar emoções. Como resultado, o R1-Omni pode analisar rapidamente e entender com mais precisão como as informações visuais e auditivas dão suporte ao reconhecimento de emoções e identificar claramente quais fatores desempenham um papel mais importante na avaliação de cada tipo de emoção.
O Alibaba está investindo pesadamente em ferramentas e aplicativos de IA. A gigante tecnológica chinesa assinou recentemente uma parceria com a Apple para levar recursos de IA aos iPhones na China e desafiou a OpenAI ao oferecer o R1-Omni gratuitamente em sua plataforma Hugging Face.
O objetivo final que o Alibaba quer alcançar é a "inteligência geral artificial" (AGI). O CEO Eddie Wu deixou claro aos analistas em fevereiro que a AGI é uma prioridade máxima para a empresa. E os últimos desenvolvimentos no campo da IA estão mostrando os esforços do Alibaba para afirmar sua posição como um grande player na corrida global da IA.
Por outro lado, a OpenAI também está ciente da crescente concorrência de plataformas de IA rivais. A empresa lançou um modelo GPT-4.5 atualizado no início deste ano, que é capaz de detectar nuances sutis em avisos do usuário. No entanto, esse modelo não é oferecido gratuitamente, mas apenas para assinantes premium, com uma taxa bastante alta de 200 USD/mês.