繼Qwen3.6-Plus發(fā)布之后,阿里巴巴(BABA)(09988)千問大模型團隊分享下一代旗艦模型的早期預覽版:Qwen3.6-Max-Preview相比Qwen3.6-Plus,本次預覽版帶來了更強的世界知識和指令遵循能力,以及在多項基準上顯著提升的智能體編程表現(xiàn)。作為預覽版,模型仍在積極迭代中,后續(xù)版本將持續(xù)優(yōu)化。Qwen3.6-Max-Preview主要特性包括:相比Qwen3.6-Plus顯著提升的智能體編程能力;更強的世界知識和指令遵循;更優(yōu)的真實場景智能體與知識可靠性表現(xiàn)。
模型性能
以下展示了 Qwen3.6-Max-Preview 與主流前沿模型的評測對比。相比 Qwen3.6-Plus,預覽版在智能體編程方面取得顯著提升(如 SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8),世界知識更強(SuperGPQA +2.3、QwenChineseBench +5.3),指令遵循也更優(yōu)(ToolcallFormatIFBench +2.8)。在權威三方評測Artificial Analysis剛剛更新的大模型榜單中,Qwen3.6-Max-Preview性能表現(xiàn)超過GLM5.1、MiniMax-M2.7等模型,登頂最佳國產(chǎn)模型。
開始使用Qwen3.6-Max-Preview Qwen3.6-Max-Preview將通過阿里(BABA)云百煉 API 提供,模型名稱為 qwen3.6-max-preview。您也可以在 Qwen Studio 上即時體驗。
API更新
阿里(BABA)云百煉支持行業(yè)標準協(xié)議,兼容 OpenAI 規(guī)范的聊天補全(chat completions)和響應(responses)API,以及兼容 Anthropic 的 API 接口。
本次發(fā)布支持 preserve_thinking 功能:在消息中保留所有前序輪次的思維內(nèi)容,推薦用于智能體任務。
總結(jié)
Qwen3.6-Max-Preview 是千問大模型下一代旗艦模型的早期預覽版,在智能體編程、世界知識和指令遵循方面相比 Qwen3.6-Plus 均有顯著提升。它在六項主要編程基準上取得最高分——SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode——相比前代有大幅進步。同時在知識(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表現(xiàn)更優(yōu)。
作為預覽版,Qwen3.6-Max-Preview仍在積極開發(fā)中。千問大模型團隊將持續(xù)迭代模型,后續(xù)版本將帶來進一步提升。
目前,千問3.6系列已推出Qwen3.6-Max-Preview、Qwen3.6-Plus、Qwen3.6-Flash,并開源Qwen3.6-35B-A3B。其中,Qwen3.6-Plus登頂全球最大的三方API調(diào)用平臺OpenRouter的日榜、周榜、趨勢榜冠軍,Qwen3.6-35B-A3B則登頂HuggingFace全球開源大模型榜單冠軍,千問3.6成為當下最受企業(yè)和開發(fā)者歡迎的大模型。
