香港商報
-- 天氣
通義千問Qwen 2.5-Max發布 阿里雲:優於DeepSeek V3

通義千問Qwen 2.5-Max發布 阿里雲:優於DeepSeek V3

責任編輯:靜文 2025-01-29 17:01:20原創 來源:香港商報網

 國產人工智能(AI)大模型DeepSeek近日震驚環球市場,阿里巴巴(9988)旗下阿里雲於新春期間發布全新通義千問Qwen 2.5-Max超大規模MoE(Mixture of Experts, 混合專家)模型,聲稱其表現超越DeepSeek V3。

微信图片_20250129165013.jpg

 阿里雲稱,通義千問 Qwen 2.5-Max採用逾20萬億token的預訓練數據,並搭配定制化後訓練方案。在Arena-Hard、LiveBench、LiveCodeBench及GPQA-Diamond等國際通用基準測試中,Qwen2.5-Ma的表現均超越DeepSeek V3,同時在MMLU-Pro等專業領域評估體系中展現出極具競爭力的成績。

微信图片_202501291650131.jpg

 阿里雲稱,相信Qwen2.5-Max隨着訓練技術不斷進步,下一個版本將達到更高水平。用戶可以在 Qwen Chat中直接調用Qwen2.5-Max,或者使用 artifacts、搜索等功能。Qwen2.5-Max 的 API(模型名稱:qwen-max-2025-01-25)已開放使用。用戶可先註冊阿里雲賬號並開通阿里雲大模型服務平台,即可於控制台創建API密鑰。由於其接口採用OpenAI兼容協議,用戶可以直接沿用OpenAI API的常規方式進行調用。

微信图片_20250129165012.jpg

 港股美國預託證券(ADR)方面,阿里巴巴ADR在美東時間1月28日收市比本港同日收市價升5.89%,港元計折合收報93.5元。(記者 黃兆琦 / 阿里雲圖片)

責任編輯:靜文 通義千問Qwen 2.5-Max發布 阿里雲:優於DeepSeek V3
香港商報PDF
股市

友情鏈接

承印人、出版人:香港商報有限公司 地址:香港九龍觀塘道332號香港商報大廈 香港商報有限公司版權所有,未經授權,不得複製或轉載。 Copyright © All Rights Reserved
聯絡我們

電話:(香港)852-2564 0768

(深圳)86-755-83518792 83518734 83518291

地址:香港九龍觀塘道332號香港商報大廈