7月30日,阿里巴巴通義千問團隊宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。這一非思考模式(non-thinking mode)的開源模型僅需激活3B參數,即可在多項核心能力上達到與Gemini 2.5-Flash(non-thinking)、GPT-4o等閉源模型相當的性能水平,同時在多語言覆蓋、用戶偏好對齊和長文本處理等領域實現突破性提升。目前,該模型已在魔搭社區(qū)(ModelScope)和HuggingFace平臺全面開源。
作為Qwen3-30B-A3B模型中的新版本,Qwen3-30B-A3B-Instruct-2507延續(xù)了通義千問團隊在架構創(chuàng)新上的優(yōu)勢,在大幅降低計算成本的同時,實現了與千億級閉源模型的性能對標。官方數據顯示,該模型在數學推理(AIME25測試得分61.3)、代碼生成(LiveCodeBenchv6得分43.2)、研究生級物理和天文學問題(GPQA測試得分70.4)、人類偏好對齊(Arena-Hard v2得分69)、函數調用能力(BFCL-v3得分65.1)等關鍵基準測試中表現突出,部分指標甚至超越GPT-4o等。
在通用能力層面,模型全面強化了指令遵循、邏輯推理、數學、科學、編程及工具使用等多方面。在多語言的長尾知識覆蓋方面,模型進步顯著;在主觀和開放任務中,新模型與進一步緊密對齊了用戶偏好,可以生成更高質量的文本,為用戶提供更有幫助的回答;長文本理解能力提升至256K。
通義千問是阿里巴巴達摩院自主研發(fā)的大語言模型系列,自2023年發(fā)布以來,已開源超200個模型,全球下載量突破3億次,衍生模型數超10萬個。