騰訊(00700.HK)推Hunyuan-Large開源大模型 AASTOCKS新聞 2024/11/05 16:02 |
內媒報道,騰訊機器學習平台總監康戰輝在混元大模型媒體溝通會上發布全新的Huanyuan-large模型。 根據官網,Hunyuan-large模型總參數量約389B,激活參數量約52B,上下文長度達256K,是當前業界參數規模最大、效果最好的Transformer架構的開源MoE模型,更適配開源框架精調和部署。Hunyuan-Large在與業界開源的DeepSeek-V2 、Llama3.1-70B、Llama3.1-405B以及Mixtral-8x22B的對比中,在CMMLU、MMLU、CEval等多學科綜合評測集、中英文NLP任務、代碼和數學等9大維度全面領先,處於行業領先水平。 康戰輝稱,公司不急於為了開源而開源,要在內部業務打磨好後再開源,要開源就要有誠意,而開源的模型必須和公司內使用的同宗同源。(jl/a) AASTOCKS新聞 網址: www.aastocks.com |