阿里巴巴發佈Qwen3 混合推理模型樹立開源AI新標桿

阿里巴巴集團發佈開源大語言模型家族最新成員Qwen3，為AI創新樹立新標桿。

Qwen3系列包含六款密集模型與兩款混合專家模型（Mixture-of-Experts, MoE），有助開發者更靈活地開發適用於移動設備、智能眼鏡、自動駕駛汽車及機器人等場景上的應用。

Qwen3全系列模型現已開源並全球上線，包含六款密集模型（參數量0.6B、1.7B、4B、8B、14B、32B）及兩款MoE模型（30B總參數、3B激活參數；235B總參數、22B激活參數）。

混合推理結合思考與非思考模式

Qwen3標誌著阿里巴巴首次推出混合推理模型，融合傳統大語言模型與先進的動態推理技術。Qwen3可無縫切換「思考模式」與「非思考模式」, 「思考模式」專攻數學演算、編程及邏輯推理等多步驟複雜任務，「非思考模式」則專注於提供高速、通用型回應。

透過API調用Qwen3，開發者可精細控制思考時長（最高達38K tokens），獲取智能表現與運算效率間的最佳平衡。值得注意的是，相較於其他頂尖模型，Qwen3-235B-A22B MoE模型大幅降低了部署成本，彰顯阿里巴巴推動高性能AI普及化的承諾。

多語言能力、智能體功能、推理、人機對齊的技術革新

基於36萬億tokens訓練數據量（較前代Qwen2.5倍增），Qwen3在推理、指令遵循、工具運用及多語言任務方面能力顯著提升。

核心能力包括：

精通多種語言：支持119種語言及方言，翻譯與多語種指令遵循表現領先業界。
先進智能體整合：原生支持模型上下文協議（Model Context Protocol, MCP），具有强大的函數調用能力（Function Calling)，複雜智能體任務表現居開源模型之首。
卓越推理能力：數學運算、編程與邏輯推理的基準測試表現全面超越前代Qwen系列（思考模式QwQ與非思考模式Qwen2.5）
強化人機對齊：提供更自然的創意寫作、角色扮演與多輪對話體驗，實現更自然、更具互動性的對話。

基於模型架構的進步、訓練數據量的提升以及更有效的訓練方法，Qwen3系列在多項業界基準測試中獲得頂尖成績，包括AIME25（數學推理）、LiveCodeBench（編程能力）、BFCL（工具及函數調用能力），以及Arena-Hard（指令微調模型基準測試）。此外，為開發混合推理模型，研發團隊採用了四階段訓練流程，包含長思維鏈（Chain-of-Thought, CoT）冷啟動、長思維鏈強化學習（Reinforcement Learning, RL）、思維模式融合與通用強化學習。

Qwen3系列在多項業界基準測試中獲得頂尖成績

開放生態驅動創新

Qwen3全系列模型現已在開源平台Hugging Face、Github及ModelScope供免費下載，並可透過chat.qwen.ai體驗。阿里巴巴AI模型開發平台Model Studio即將開放API接入服務。Qwen3將用於支持阿里巴巴旗艦級AI超級助手「夸克」。

自發佈以來，Qwen模型家族全球下載量突破3億次。在Hugging Face平台，基於Qwen創建的衍生模型已超10萬個，令Qwen成爲全球應用最廣泛採用的開源AI模型系列之一。

立即訂閱阿里足跡，緊貼阿里巴巴集團最新發展動向，通過新聞故事及專題文章了解創新科技、電子商務及智能物流等新興議題的嶄新趨勢

Qwen3

2025年04月22日 |
科技創新

中國銀河國際携手阿里雲打造AI驅動智慧金融服務

2025年04月29日 |
科技創新

夸克「AI超級框」升級推出「AI相機」提升多模態能力