商汤(00020.HK) +0.070 (+5.691%) 沽空 $2.09千万; 比率 3.958% 大装置事业群研发总监张行程出席华为全联接大会2024时表示,多年来商汤大模型基於昇腾原生开发进行实践,共同推进基础模型、行业大模型应用与创新,通过高效并行、通信优化及网络架构感知和任务调度等技术改善,构建大规模并行训练加速系统。
其中102B模型的训练性能已达到业界的120%以上,同时单一任务集群规模扩展至3倍,算力效率损失仅为3%,线性加速比可高达97%以上。他又指,基於昇腾计算生态,商汤已建设长序列并行训练加速机制,与业界相比,4K序列性能提升1倍以上,32K序列性能持平,更可处理128K长序列训练。
他表示,通过与昇腾团队合作,商汤已将全栈大模型生产能力产品化,构建从基础层、模型层、串联层到应用层的高效、完备、易用的大模型生产工具链。(gc/k)(港股报价延迟最少十五分钟。沽空资料截至 2024-09-25 12:25。)
AASTOCKS新闻