返回    放大 +    缩小 -
阿里巴巴(09988)通义千问发布并开源 Qwen3
推荐
24
利好
40
利淡
4
汇港资讯
<汇港通讯> 阿里巴巴(09988)通义千问周二凌晨发布新版 Qwen3 系列人工智能(AI)模型,公司声称,新版模型可以匹敌 Google(谷歌)和 OpenAI 提供的最佳模型,在某些情况下甚至优於竞争对手。

新版 Qwen3 包括2个 MoE 模型和6个 Dense 模型,参数量从6亿个到2350亿个。与 DeepSeek-R1、OpenAI o1 及 o3-mini、马斯克的 Grok 3 和 Google Gemini 2.5 Pro 等其他顶级模型比较,旗舰模型 Qwen3-235B-A22B 在编码、数学、通用能力等基准评估中,取得具竞争力的结果。

小型 MoE 模型 Qwen3-30B-A3B 的活化参数量是 QwQ-32B 的10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型,也能匹敌 Qwen2.5-72B-Instruct 的表现。

六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。

Qwen3 模式支持两种思考模式,其一为思考模式,在这种模式下,模型会逐步推理,经过深思熟虑後给予最终答案。这种方法非常适合需要深入思考的复杂问题。其二是非思考模式,能提供快速、近乎即时的反应,适用於对速度要求高於深度的简单问题。

通义千问并表示,Qwen3 模型推理能力大幅提升,在数学、程式码和逻辑推理等评测中,达到同规模业界 SOTA 水准。 (BC)

#阿里巴巴 #通义千问 #Qwen3
新闻来源 (不包括新闻图片): 汇港资讯