阿里云智能首席技术官(CTO)周靖人於2024云栖大会上发布通义千问新一代开源模型Qwen2.5,全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,其中旗舰模型Qwen2.5-72B性能超越Llama 405B。
与Qwen2相比,Qwen2.5全系列模型都在18T tokens数据上进行预训练,整体性能提升逾18%,拥有更多的知识、更强的编程和数学能力。Qwen2.5-72B模型在MMLU-rudex基准(考察通用知识)、MBPP基准(考察代码能力)和MATH基准(考察数学能力)的得分高达86.8、88.2、83.1。Qwen2.5可生成最多8,000字内容,支援中文、英文、法文、西班牙文、俄文、日文、越南文与阿拉伯文等29种以上语言。
相关内容《大行》交银国际对中资电商股评级、目标价及估值预测(表)
在多模态模型方面,阿里云宣布视觉语言模型Qwen2-VL-72B开源,Qwen2-VL能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机械人的视觉智能体能力。(jl/)
AASTOCKS新闻