10月18日|在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决AI模型服务中普遍存在的GPU资源浪费问题。在阿里云模型市场进行的为期超过三个月的Beta测试中,Aegaeon系统展现了卓越的效能。测试数据显示,服务数十个参数量高达720亿的大模型,所需的英伟达H20 GPU数量从1192个成功减少至213个,数量削减高达82%。