最新搜看股票
报价
返回 放大 + 缩小 - | |
阿里(09988.HK)通义千问开源首个长文本新模型 支援100万Tokens上下文
推荐 25 利好 36 利淡 15 AASTOCKS新闻
|
|
阿里巴巴(09988.HK)(BABA.US)数字技术与智能骨干业务阿里云旗下通义千问宣布,推出最新的开源模型Qwen2.5-1M,分为Qwen2.5-7B-Instruct-1M及Qwen2.5-14B-Instruct-1M,是通义千问首次推出原生支援100万Token上下文长度的模型,能够处理书籍、长篇报告、法律文件等超长文档,用户毋须进行繁琐的文档分割,该模型将能够记住更长的对话历史纪录,实现更连贯、更自然的交互体验,亦能更好地理解代码、复杂推理、多轮对话等。 阿里云又指,Qwen2.5-1M另一重大突破是快速推理框架,指出通义千问团队已完全开源基於vLLM的推理框架,并与稀疏注意力方法整合,令该模型在处理百万Token输入时速度可提升三至七倍。(gc/w) AASTOCKS新闻 |
|