Alibaba da China supera Meta com novos modelos de IA Qwen 3

Resumo:

A gigante tecnológica chinesa Alibaba lançou uma família de modelos de IA Qwen 3 de código aberto. A coleção inclui 8 novos modelos.
O modelo líder, Qwen3-235B-A22B MoE, foi treinado em 235 bilhões de parâmetros, com 22 bilhões de parâmetros ativados.
O modelo menor, Qwen3-30B-A3B MoE, que tem apenas 3 bilhões de parâmetros ativados, supera o GPT-4o por uma grande margem.

A gigante chinesa de tecnologia Alibaba lançou oito novos modelos de inteligência artificial (IA) de código aberto em sua série Qwen 3. Os novos modelos Qwen 3 incluem dois modelos MoE (Mixture of Experts), Qwen3-235B-A22B e Qwen3-30B-A3B. O Qwen3-235B-A22B é o maior e principal modelo, com um total de 235 bilhões de parâmetros e 22 bilhões de parâmetros ativados.

O Qwen3-30B-A3B é um modelo MoE menor com um total de 30 bilhões de parâmetros e 3 bilhões de parâmetros ativados. Além disso, há seis modelos densos na série Qwen 3, incluindo Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B e Qwen3-0.6B. Esses novos modelos de IA do Alibaba Qwen 3 fortalecem ainda mais a posição da empresa no campo da inteligência artificial.

Apresentando o Qwen3!

Lançamos e abrimos o Qwen3, nossos mais recentes modelos de linguagem grande, incluindo 2 modelos MoE e 6 modelos densos, variando de 0.6B a 235B. Nosso modelo principal, Qwen3-235B-A22B, alcança resultados competitivos em avaliações de referência de codificação, matemática, geral… foto.twitter.com/JWZkJeHWhC

-Qwen (@Alibaba_Qwen) 28 de abril de 2025

Todos os modelos Qwen 3 oferecem suporte a Modos de Pensamento Híbridos, o que significa que são modelos de IA inferenciais e modelos tradicionais de grandes linguagens (LLMs) ao mesmo tempo. No “modo de pensamento”, o modelo pode inferir passo a passo, enquanto no “modo de não pensamento”, o modelo fornece uma resposta rápida. Esse recurso aumenta a flexibilidade de uso do modelo em diversas aplicações.

além de, Apoio, suporte Os modelos Qwen 3 suportam mais de 119 idiomas e dialetos de todo o mundo. É um dos modelos multilíngues mais versáteis. Além disso, o Alibaba aprimorou o suporte ao Protocolo de Contexto do Modelo (MCP) para os modelos Qwen 3, liberando recursos adicionais de agente. Essa melhoria permite que os modelos entendam melhor o contexto e tomem decisões mais inteligentes.

Em termos de desempenho, o modelo maior Qwen3-235B-A22B oferece resultados competitivos em linha com DeepSeek R1 e Grok 3 Beta e Gêmeos 2.5 Pró e OpenAI o1. O que acho interessante é que o modelo menor Qwen3-30B-A3B, que tem apenas 3 bilhões de parâmetros ativos, supera o DeepSeek V3 e o modelo GPT-4o da OpenAI. Isso indica alta eficiência de recursos e a capacidade de atingir desempenho excepcional com um tamanho de modelo menor.

O Alibaba diz que os modelos Qwen 3 têm bom desempenho em programação, matemática, ciências e habilidades gerais. No geral, o Qwen 3 representa uma família de modelos de IA avançados e altamente capazes da China. Agora, com o próximo DeepSeek R2, a China está bem posicionada para competir com os laboratórios de IA ocidentais. Este desenvolvimento reflete o rápido progresso da China no campo da inteligência artificial.