内地社交平台小红书开源首个大模型「dots.llm1」。「dots.llm1」为一个1,420亿参数的专家混合模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。「dots.llm1」最大特色是使用11.2万亿token的非合成高质量训练数据,属现阶段开源大模型中非常罕见。在中文测试中「dots.llm1」的性能非常强,以91.3的平均分超过DeepSeek开源的V2、V3和阿里开源的Qwen2.5 32B和72B。(ta/j)