Alibaba lança modelo de raciocínio visual QVQ-Max: pode ver, entender e pensar
O grupo de tecnologia chinês Alibaba acaba de anunciar um novo modelo de IA chamado QVQ-Max da série Qwen, marcando um avanço no campo da IA multimídia.
A gigante chinesa de comércio eletrônico Alibaba continua a ser manchete ao lançar um novo modelo de IA que, segundo ela, é capaz de ler emoções humanas. O modelo, chamado "R1-Omni", foi desenvolvido por uma equipe de engenheiros do Tongyi Lab do Alibaba. Com a leitura de emoções no centro da interação do usuário, a Alibaba afirma com confiança que o R1-Omni pode superar completamente concorrentes como o ChatGPT da OpenAI e muitos outros modelos de LLM atualmente no mercado em termos de experiência no mundo real.
Notavelmente, o R1-Omni é oferecido como código aberto. Em demonstrações, esse modelo de IA foi capaz de entender emoções humanas a partir de vídeos, além de descrever suas roupas e arredores. O novo modelo de IA do Alibaba leva a visão computacional para o próximo nível, com base em um modelo lançado anteriormente chamado HumanOmni, também criado pelo pesquisador Jiaxing Zhao e seus colegas do Tongyi Lab.
Tecnicamente, o R1-Omni pode ser considerado o primeiro modelo abrangente de linguagem multimodal que aplica aprendizado por reforço com recompensas verificáveis (RLVR) – uma tecnologia que promete aprimorar a capacidade da IA de raciocinar e analisar emoções. Como resultado, o R1-Omni pode analisar rapidamente e entender com mais precisão como as informações visuais e auditivas dão suporte ao reconhecimento de emoções e identificar claramente quais fatores desempenham um papel mais importante na avaliação de cada tipo de emoção.
O Alibaba está investindo pesadamente em ferramentas e aplicativos de IA. A gigante tecnológica chinesa assinou recentemente uma parceria com a Apple para levar recursos de IA aos iPhones na China e desafiou a OpenAI ao oferecer o R1-Omni gratuitamente em sua plataforma Hugging Face.
O objetivo final que o Alibaba quer alcançar é a "inteligência geral artificial" (AGI). O CEO Eddie Wu deixou claro aos analistas em fevereiro que a AGI é uma prioridade máxima para a empresa. E os últimos desenvolvimentos no campo da IA estão mostrando os esforços do Alibaba para afirmar sua posição como um grande player na corrida global da IA.
Por outro lado, a OpenAI também está ciente da crescente concorrência de plataformas de IA rivais. A empresa lançou um modelo GPT-4.5 atualizado no início deste ano, que é capaz de detectar nuances sutis em avisos do usuário. No entanto, esse modelo não é oferecido gratuitamente, mas apenas para assinantes premium, com uma taxa bastante alta de 200 USD/mês.
Qual é a empresa mais antiga do mundo? Em que ano foi fundada a empresa mais antiga do mundo? Vamos descobrir juntos!
Na nova versão One UI 3.0 da Samsung, os usuários podem usar muitos outros recursos interessantes e atraentes, como revisar notificações excluídas na barra de status da Samsung.
Quais são os melhores e mais curtos desejos de 19 de novembro para seu amor? Se você está sem ideias, este artigo vai sugerir desejos significativos para 19 de novembro.
Os suéteres básicos são uma parte indispensável de todos os nossos guarda-roupas de outono e inverno. Veja como misturar e combinar suéteres de uma forma simples, mas elegante.
Ter inimigos é sempre uma situação desagradável. Felizmente, você pode transformar seus inimigos em amigos. Aqui estão algumas maneiras simples de consertar um relacionamento que estão disponíveis para todos.
Como a Netflix é facilmente acessível em todos os dispositivos, incluindo celulares, tablets, consoles de jogos e dispositivos de streaming, você deve estar se perguntando quantas pessoas podem assistir à Netflix ao mesmo tempo na mesma conta.
Centralizar células no Word ao trabalhar com tabelas é uma operação que precisa ser realizada para reformatar o texto em cada célula de acordo com as normas, bem como criar uma tabela do Word com um layout mais bonito e fácil de visualizar.
A Samsung Electronics está supostamente colaborando com a OpenAI em um ambicioso projeto conjunto para desenvolver TVs com IA que incorporem tecnologias de inteligência artificial líderes do setor.
Depois de muitos snapshots, adições e alterações, a atualização está completa e pronta para lançamento. A data oficial de lançamento do Minecraft 1.21 acaba de ser revelada!
Em uma impressionante demonstração de criatividade, 16 robôs humanoides da Unitree, empresa líder em robótica da China, ganharam destaque na Gala do Festival da Primavera anual da CCTV.
Por que as roupas e toalhas secas à máquina são macias e suaves, mas quando penduradas para secar geralmente ficam ásperas ou ásperas?
Os satélites da NASA usam uma ferramenta de imagem chamada Resolve, que tem um sensor de apenas 36 pixels.
Ao abrir a App Store no iPhone, iPad, Mac para baixar aplicativos ou jogos, aparece o erro Não é possível conectar à iTunes Store e aqui está a solução.
VPN (Virtual Private Network) é entendida simplesmente como um sistema de rede privada virtual, capaz de criar uma conexão de rede baseada em um determinado provedor de serviços.
O Dia dos Namorados é um dia para os casais expressarem seus sentimentos um pelo outro. Você pode criar cartões de Dia dos Namorados para enviar ao seu parceiro, colagens de fotos para comemorar o Dia dos Namorados ou criar vídeos para o Dia dos Namorados.