Meta Lança Muse Spark, a Sua IA Mais Capaz Até Agora—Mas o Gemini 3.1 Pro Ainda Lidera o Grupo

Em resumo

O novo Muse Spark da Meta marca uma mudança para IA fechada, nativamente multimodal com raciocínio baseado em agentes.
A Meta reporta ganhos significativos em benchmarks de saúde e pesquisa, mas ainda fica atrás do Gemini no raciocínio central e codificação.
Construído em nove meses com muito menos capacidade de computação, isto aponta para uma nova estratégia de IA focada em eficiência.

A Meta lançou o Muse Spark na quarta-feira, marcando o primeiro modelo construído pelos Meta Superintelligence Labs—a equipa formada há nove meses sob o Diretor de IA Alexandr Wang após a aquisição de 14 mil milhões de dólares da Scale AI pela Meta. Está agora disponível em meta.ai e na aplicação Meta AI, com implementação no Facebook, Instagram e WhatsApp prevista para as próximas semanas.

Isto não é apenas mais uma atualização de chatbot ou uma nova versão do Llama. O Muse Spark é nativamente multimodal—processa imagens, texto e voz desde a base, em vez de adicionar visão a um modelo de texto existente. Vem com cadeia de pensamento visual, suporte para uso de ferramentas e algo que a Meta está a chamar de "modo de contemplação": uma configuração que executa múltiplos agentes de IA em paralelo para enfrentar problemas mais difíceis. Esta é a resposta da Meta aos modos de pensamento estendido do Gemini Deep Think da Google e do GPT Pro da OpenAI.

"O Muse Spark é o primeiro passo na nossa escada de escalabilidade e o primeiro produto de uma reformulação completa dos nossos esforços de IA", escreveu a Meta num comunicado oficial. "Para apoiar maior escalabilidade, estamos a fazer investimentos estratégicos em toda a pilha—desde pesquisa e treino de modelos até infraestrutura, incluindo o centro de dados Hyperion."

A empresa trabalhou com mais de 1.000 médicos para organizar dados de treino para o raciocínio médico do Muse Spark. Os resultados no HealthBench Hard—um benchmark de consultas de saúde abertas—são impressionantes: o Muse Spark obteve 42,8 pontos, comparado com 40,1 para o GPT 5.4 e apenas 20,6 para o Gemini 3.1 Pro. Não é uma diferença marginal.

Na pesquisa baseada em agentes (DeepSearchQA), o Muse Spark também lidera com 74,8, superando o Gemini (69,7) e o GPT 5.4 (73,6). No CharXiv Reasoning—compreensão de figuras de artigos científicos—obteve 86,4, a pontuação mais alta entre os modelos na comparação.

Para aqueles interessados em fazer jailbreak de IA, o modelo foi descodificado em minutos:

Mas bom não é o mesmo que excelente. O panorama geral dos benchmarks mostra o Gemini 3.1 Pro ainda à frente na maioria das categorias. A diferença é mais visível no ARC AGI 2, o benchmark de raciocínio abstrato: o Gemini obteve 76,5 contra 42,5 do Muse Spark.

Na codificação (LiveCodeBench Pro), os 82,9 do Gemini ultrapassam os 80,0 da Meta. No MMMU Pro—compreensão multimodal—o Gemini obteve 83,9 versus 80,4. O próprio blogue da Meta reconhece lacunas de desempenho atuais em sistemas baseados em agentes de longo alcance e fluxos de trabalho de codificação.

Há também uma mudança estratégica notável neste lançamento. O Muse Spark é um modelo fechado—a sua arquitetura e pesos não serão tornados públicos. Isto é um afastamento acentuado do Llama, que construiu a reputação da Meta nos círculos de IA aberta. Após a receção decepcionante do Llama 4 no início deste ano, a Meta parece ter decidido que o próximo capítulo precisa de ser escrito de forma diferente.

A empresa diz que espera disponibilizar em código aberto versões futuras do Muse, mas por enquanto o código permanece dentro da Meta. As ações da gigante tecnológica subiram quase 9% na quarta-feira após o anúncio, e terminaram o dia de negociação com uma subida de 6,5% para um preço de 612,42 dólares.

O "modo de contemplação" usa orquestração de agentes em paralelo para elevar o teto do modelo. Nessa configuração, o Muse Spark atingiu 58% no Humanity's Last Exam e 38% no FrontierScience Research—território que o torna competitivo com as versões mais capazes do Gemini e GPT, em vez dos seus lançamentos padrão.

A Meta também está a lançar um assistente de compras que compara produtos e liga diretamente a compras, e planeia trazer o Muse Spark para o Facebook, Instagram e WhatsApp nas próximas semanas—seguindo o mesmo plano implementado desde o Llama 3, colocando-o à frente de mais de 3,5 mil milhões de utilizadores. Uma pré-visualização privada da API está a abrir para programadores selecionados.

O modelo foi construído em nove meses, com o nome de código interno Avocado, com a Meta a afirmar que a sua nova pilha de pré-treino pode atingir o mesmo nível de capacidade do Llama 4 Maverick usando mais de 10 vezes menos capacidade de computação.

O Muse Spark é descrito internamente como um primeiro passo "pequeno e rápido" na família Muse. Uma versão mais capaz já está em desenvolvimento.

Newsletter Daily Debrief

Comece todos os dias com as principais notícias do momento, além de funcionalidades originais, um podcast, vídeos e muito mais.

Fonte: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads

Meta Lança Muse Spark, a Sua IA Mais Capaz Até Agora—Mas o Gemini 3.1 Pro Ainda Lidera o Grupo

Em resumo

Newsletter Daily Debrief

Você também pode gostar

Gate ra mắt giao dịch hợp đồng vĩnh cửu UP (Unitas)

Nhà đầu tư đẩy giá Bitcoin tăng nhờ tin ngừng bắn?

Bộ trưởng Quốc phòng Mỹ: Iran không được sở hữu vũ khí hạt nhân

Notícias em alta

Mercado Cripto Dispara Enquanto EUA-Irão Discutem Cessar-Fogo de 45 Dias, Preço do BTC de Olho nos $70.000

Mineradores de Bitcoin Subvalorizados: A Revelação Impressionante da Morgan Stanley sobre a Procura de Energia por IA

'Vigarista mentalmente instável': Os lacaios mais leais de Trump iniciam pelotão de fuzilamento circular

AequiSolva Reforça a Execução de Ativos Digitais Enquanto a Volatilidade Extrema da Energia Desencadeia a Reavaliação Global de Ativos

Uma nova exposição diz que Adam Back é o criador da Bitcoin, Satoshi Nakamoto. Aqui está uma lista de todos os outros suspeitos

Notícias ao vivo 24/7

Preços das criptomoedas