
a alibaba revelou recentemente, de forma oficial, o modelo‑chefe de próxima geração da série qwen — o qwen3.6‑max‑preview. como uma versão preliminar antecipada da série, os usuários já podem participar de conversas interativas com ele no qwenstudio e invocá‑lo por meio da api alibaba cloud bailian, sob o nome “qwen3.6‑max‑preview”. em comparação com a geração anterior, o qwen3.6‑plus, o novo modelo apresenta melhorias significativas em múltiplas dimensões, incluindo programação baseada em agentes, conhecimento do mundo e seguimento de instruções.
segundo a alibaba, o qwen3.6‑max‑preview obteve as pontuações mais altas em seis importantes testes de benchmark de programação, abrangendo o swe‑benchpro, o terminal‑bench2.0, o skillsbench, o qwenclawbench, o qwenwebbench e o scicode. em particular, suas capacidades de programação baseada em agentes melhoraram consideravelmente: as pontuações no skillsbench aumentaram em 9,9 pontos, no scicode em 10,8 pontos, e no nl2repo e no terminal‑bench2.0 em 5,0 e 3,8 pontos, respectivamente. esses resultados representam um avanço significativo nas habilidades de programação do modelo.
além disso, o qwen3.6‑max‑preview também registrou um notável aprimoramento em sua compreensão do conhecimento mundial, com as pontuações no supergpqa subindo 2,3 pontos e o qwenchinesebench melhorando em 5,3 pontos. sua capacidade de seguir instruções também é impressionante, já que as pontuações no toolcallformatifbench aumentaram em 2,8 pontos. em conjunto, essas melhorias posicionam o novo modelo como uma importante inovação no campo da programação inteligente.
embora atualmente esteja disponível apenas como versão preliminar, a alibaba afirma que o modelo ainda está em desenvolvimento ativo, com futuras iterações passando por otimizações contínuas, visando oferecer recursos ainda mais poderosos e ganhos de desempenho.