阿里巴巴發佈Qwen3 混合推理模型樹立開源AI新標桿
阿里巴巴集團發佈開源大語言模型家族最新成員Qwen3,為AI創新樹立新標桿。
Qwen3系列包含六款密集模型與兩款混合專家模型(Mixture-of-Experts, MoE),有助開發者更靈活地開發適用於移動設備、智能眼鏡、自動駕駛汽車及機器人等場景上的應用。
Qwen3全系列模型現已開源並全球上線,包含六款密集模型(參數量0.6B、1.7B、4B、8B、14B、32B)及兩款MoE模型(30B總參數、3B激活參數;235B總參數、22B激活參數)。
混合推理結合思考與非思考模式
Qwen3標誌著阿里巴巴首次推出混合推理模型,融合傳統大語言模型與先進的動態推理技術。Qwen3可無縫切換「思考模式」與「非思考模式」, 「思考模式」專攻數學演算、編程及邏輯推理等多步驟複雜任務,「非思考模式」則專注於提供高速、通用型回應。
透過API調用Qwen3,開發者可精細控制思考時長(最高達38K tokens),獲取智能表現與運算效率間的最佳平衡。值得注意的是,相較於其他頂尖模型,Qwen3-235B-A22B MoE模型大幅降低了部署成本,彰顯阿里巴巴推動高性能AI普及化的承諾。
多語言能力、智能體功能、推理、人機對齊的技術革新
基於36萬億tokens訓練數據量(較前代Qwen2.5倍增),Qwen3在推理、指令遵循、工具運用及多語言任務方面能力顯著提升。
核心能力包括:
- 精通多種語言:支持119種語言及方言,翻譯與多語種指令遵循表現領先業界。
- 先進智能體整合:原生支持模型上下文協議(Model Context Protocol, MCP),具有强大的函數調用能力(Function Calling),複雜智能體任務表現居開源模型之首。
- 卓越推理能力:數學運算、編程與邏輯推理的基準測試表現全面超越前代Qwen系列(思考模式QwQ與非思考模式Qwen2.5)
- 強化人機對齊:提供更自然的創意寫作、角色扮演與多輪對話體驗,實現更自然、更具互動性的對話。
基於模型架構的進步、訓練數據量的提升以及更有效的訓練方法,Qwen3系列在多項業界基準測試中獲得頂尖成績,包括AIME25(數學推理)、LiveCodeBench(編程能力)、BFCL(工具及函數調用能力),以及Arena-Hard(指令微調模型基準測試)。此外,為開發混合推理模型,研發團隊採用了四階段訓練流程,包含長思維鏈(Chain-of-Thought, CoT)冷啟動、長思維鏈強化學習(Reinforcement Learning, RL)、思維模式融合與通用強化學習。

Qwen3系列在多項業界基準測試中獲得頂尖成績
開放生態驅動創新
Qwen3全系列模型現已在開源平台Hugging Face、Github及ModelScope供免費下載,並可透過chat.qwen.ai體驗。阿里巴巴AI模型開發平台Model Studio即將開放API接入服務。Qwen3將用於支持阿里巴巴旗艦級AI超級助手「夸克」。
自發佈以來,Qwen模型家族全球下載量突破3億次。在Hugging Face平台,基於Qwen創建的衍生模型已超10萬個,令Qwen成爲全球應用最廣泛採用的開源AI模型系列之一。
立即訂閱阿里足跡,緊貼阿里巴巴集團最新發展動向,通過新聞故事及專題文章了解創新科技、電子商務及智能物流等新興議題的嶄新趨勢


分享