No que depender da Alibaba, o DeekSeek não vai ser a única ferramenta de IA generativa da China a causar alvoroço no setor de tecnologia. A companhia anunciou um modelo de inteligência artificial chamado QwQ-32B que promete competir em desempenho com o DeekSeek R1.

Sendo mais exato, o QwQ-32B é um modelo de raciocínio que, como o nome sugere, trabalha com 32 bilhões de parâmetros. Trata-se de um projeto de código aberto conduzido pela Qwen, uma das várias divisões da gigante chinesa Alibaba.

O QwQ-32B foi anunciado em novembro de 2024 como um modelo capaz de fazer frente à prévia do modelo o1, da OpenAI. Contudo, testes feitos com o QwQ-32B nas semanas subsequentes mostraram que o modelo ainda precisava de refinamentos.

Foi quando a Alibaba decidiu liberar o QwQ-32B publicamente sob uma licença Apache 2.0. A partir daí, o modelo passou a ser testado com mais intensidade por outras organizações e indivíduos. O efeito disso é que, de novembro para cá, o projeto apresentou uma evolução considerável.

O que o QwQ-32B é capaz de fazer?

A Alibaba enfatiza que o QwQ-32B, com seus 32 bilhões de parâmetros, atingiu desempenho próximo ao de modelos como o DeepSeek R1 e o OpenAI o1-mini em testes de benchmark que envolvem raciocínio matemático, codificação e capacidade geral de resolução de problemas.

Nos gráficos a seguir, divulgados pela Qwen, é possível notar que, de fato, o QwQ-32B apresentou desempenho muito próximo ao DeepSeek R1, modelo que conta com 671 bilhões de parâmetros, sendo que 37 bilhões estavam ativos nos testes.

Em parte, os resultados apresentados pelo QwQ-32B se devem à incorporação de uma técnica de aprendizado por reforço (RL, na sigla em inglês) ao projeto.

Também contribui para o desempenho do QwQ-32B a ampliação de sua janela de contexto de 32.000 para 131.000 tokens.

Já posso testar o atual QwQ-32B?

Pode, sim. A forma mais rápida e fácil de se fazer isso é acessando o Qwen Chat (sim, funciona em português) e escolhendo o modelo QwQ-32B-Preview na lista de seleção.

Quem quiser fazer testes mais elaborados, em aplicações próprias, por exemplo, pode obter o QwQ-32B no Hugging Face ou no ModelScope.

Alibaba diz que seu modelo de IA já é tão bom quanto o DeepSeek