O artigo Meta Lança Muse Spark, a Sua IA Mais Capaz Até Agora—Mas o Gemini 3.1 Pro Continua a Liderar apareceu em BitcoinEthereumNews.com. Em resumo, o novo Muse da MetaO artigo Meta Lança Muse Spark, a Sua IA Mais Capaz Até Agora—Mas o Gemini 3.1 Pro Continua a Liderar apareceu em BitcoinEthereumNews.com. Em resumo, o novo Muse da Meta

Meta Lança Muse Spark, a Sua IA Mais Capaz Até Agora—Mas o Gemini 3.1 Pro Ainda Lidera o Grupo

2026/04/09 04:32
Leu 5 min
Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em [email protected]

Em resumo

  • O novo Muse Spark da Meta marca uma mudança para IA fechada, nativamente multimodal com raciocínio baseado em agentes.
  • A Meta reporta ganhos significativos em benchmarks de saúde e pesquisa, mas ainda fica atrás do Gemini no raciocínio central e codificação.
  • Construído em nove meses com muito menos capacidade de computação, isto aponta para uma nova estratégia de IA focada em eficiência.

A Meta lançou o Muse Spark na quarta-feira, marcando o primeiro modelo construído pelos Meta Superintelligence Labs—a equipa formada há nove meses sob o Diretor de IA Alexandr Wang após a aquisição de 14 mil milhões de dólares da Scale AI pela Meta. Está agora disponível em meta.ai e na aplicação Meta AI, com implementação no Facebook, Instagram e WhatsApp prevista para as próximas semanas.

Isto não é apenas mais uma atualização de chatbot ou uma nova versão do Llama. O Muse Spark é nativamente multimodal—processa imagens, texto e voz desde a base, em vez de adicionar visão a um modelo de texto existente. Vem com cadeia de pensamento visual, suporte para uso de ferramentas e algo que a Meta está a chamar de "modo de contemplação": uma configuração que executa múltiplos agentes de IA em paralelo para enfrentar problemas mais difíceis. Esta é a resposta da Meta aos modos de pensamento estendido do Gemini Deep Think da Google e do GPT Pro da OpenAI.

"O Muse Spark é o primeiro passo na nossa escada de escalabilidade e o primeiro produto de uma reformulação completa dos nossos esforços de IA", escreveu a Meta num comunicado oficial. "Para apoiar maior escalabilidade, estamos a fazer investimentos estratégicos em toda a pilha—desde pesquisa e treino de modelos até infraestrutura, incluindo o centro de dados Hyperion."

A empresa trabalhou com mais de 1.000 médicos para organizar dados de treino para o raciocínio médico do Muse Spark. Os resultados no HealthBench Hard—um benchmark de consultas de saúde abertas—são impressionantes: o Muse Spark obteve 42,8 pontos, comparado com 40,1 para o GPT 5.4 e apenas 20,6 para o Gemini 3.1 Pro. Não é uma diferença marginal.

Na pesquisa baseada em agentes (DeepSearchQA), o Muse Spark também lidera com 74,8, superando o Gemini (69,7) e o GPT 5.4 (73,6). No CharXiv Reasoning—compreensão de figuras de artigos científicos—obteve 86,4, a pontuação mais alta entre os modelos na comparação.

Para aqueles interessados em fazer jailbreak de IA, o modelo foi descodificado em minutos:

Mas bom não é o mesmo que excelente. O panorama geral dos benchmarks mostra o Gemini 3.1 Pro ainda à frente na maioria das categorias. A diferença é mais visível no ARC AGI 2, o benchmark de raciocínio abstrato: o Gemini obteve 76,5 contra 42,5 do Muse Spark.

Na codificação (LiveCodeBench Pro), os 82,9 do Gemini ultrapassam os 80,0 da Meta. No MMMU Pro—compreensão multimodal—o Gemini obteve 83,9 versus 80,4. O próprio blogue da Meta reconhece lacunas de desempenho atuais em sistemas baseados em agentes de longo alcance e fluxos de trabalho de codificação.

Há também uma mudança estratégica notável neste lançamento. O Muse Spark é um modelo fechado—a sua arquitetura e pesos não serão tornados públicos. Isto é um afastamento acentuado do Llama, que construiu a reputação da Meta nos círculos de IA aberta. Após a receção decepcionante do Llama 4 no início deste ano, a Meta parece ter decidido que o próximo capítulo precisa de ser escrito de forma diferente.

A empresa diz que espera disponibilizar em código aberto versões futuras do Muse, mas por enquanto o código permanece dentro da Meta. As ações da gigante tecnológica subiram quase 9% na quarta-feira após o anúncio, e terminaram o dia de negociação com uma subida de 6,5% para um preço de 612,42 dólares.

O "modo de contemplação" usa orquestração de agentes em paralelo para elevar o teto do modelo. Nessa configuração, o Muse Spark atingiu 58% no Humanity's Last Exam e 38% no FrontierScience Research—território que o torna competitivo com as versões mais capazes do Gemini e GPT, em vez dos seus lançamentos padrão.

A Meta também está a lançar um assistente de compras que compara produtos e liga diretamente a compras, e planeia trazer o Muse Spark para o Facebook, Instagram e WhatsApp nas próximas semanas—seguindo o mesmo plano implementado desde o Llama 3, colocando-o à frente de mais de 3,5 mil milhões de utilizadores. Uma pré-visualização privada da API está a abrir para programadores selecionados.

O modelo foi construído em nove meses, com o nome de código interno Avocado, com a Meta a afirmar que a sua nova pilha de pré-treino pode atingir o mesmo nível de capacidade do Llama 4 Maverick usando mais de 10 vezes menos capacidade de computação.

O Muse Spark é descrito internamente como um primeiro passo "pequeno e rápido" na família Muse. Uma versão mais capaz já está em desenvolvimento.

Newsletter Daily Debrief

Comece todos os dias com as principais notícias do momento, além de funcionalidades originais, um podcast, vídeos e muito mais.

Fonte: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads

Oportunidade de mercado
Logo de HashPack
Cotação HashPack (PACK)
$0.00797
$0.00797$0.00797
-2.56%
USD
Gráfico de preço em tempo real de HashPack (PACK)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail [email protected] para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

$30,000 em PRL + 15,000 USDT

$30,000 em PRL + 15,000 USDT$30,000 em PRL + 15,000 USDT

Deposite e negocie PRL e aumente suas recompensas!