DeepSeek发布最新NSA 加速文本训练与推理财经新闻 Financial News

桌面版

推荐

利好

利淡

AASTOCKS新闻

DeepSeek发布最新技术论文《原生稀疏注意力：硬件对齐且可原生训练的稀疏注意力机制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)。论文署名中，DeepSeek创始人梁文锋也作为共创在列。

该论文提出一种名为NSA(Natively Sparse Attention)，即「原生稀疏注意力」的新型注意力机制。NSA是一种用於超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。据分析，在64K长文本场景下，NSA实现解码速度提升11.6倍、前向传播9倍加速及反向传播6倍加速。(ta/w)

相关内容内地拆息全面上升隔夜shibor升0.4个基点至1.893厘

AASTOCKS新闻

已将连结复制到剪贴簿

备注

(1) 所有香港指数为即时指数

主页|实时行情|市场|新闻|指数
意见箱|免责声明

查看: 手机|桌面
语言: 繁|简|EN

回到页顶

联络我们
支援电邮: support@aastocks.com