首页 > 读书笔记 > 读书笔记 > 阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决 AI 模型服务中普遍存在的 GPU 资源浪费问题

阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决 AI 模型服务中普遍存在的 GPU 资源浪费问题

发布时间:2025-10-19 15:01:27

10 月 18 日消息,南华早报今天(10 月 18 日)发布博文,报道称在韩国首尔举办的第 31 届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决 AI 模型服务中普遍存在的 GPU 资源浪费问题。

SOSP 是计算机操作系统领域的顶尖会议,相当于计算机操作系统界的“奥斯卡”,其录取率控制非常严格,平均每年收录的论文数量仅有数十篇,入选论文代表了操作系统和软件领域最具代表的研究成果。

博文称云服务商当前在提供 AI 模型服务时,面临着严重的资源效率低下问题。平台需要同时托管数千个 AI 模型以处理海量并发 API 调用,但用户请求往往高度集中在少数几个热门模型上,例如阿里巴巴的 Qwen 系列模型。

研究人员发现,这种“长尾效应”导致了严重的资源闲置:在阿里云的模型市场中,竟有 17.7% 的 GPU 算力仅被用于处理 1.35% 的请求,造成了巨大的成本浪费。

为解决这一痛点,Aegaeon 系统应运而生。它通过创新的 GPU 资源池化技术,允许单个 GPU 动态服务于多个不同的 AI 模型,打破了以往 GPU 与特定模型绑定的低效模式。

在阿里云模型市场进行的为期超过三个月的 Beta 测试中,Aegaeon 系统展现了卓越的效能。测试数据显示,服务数十个参数量高达 720 亿的大模型,所需的英伟达 H20 GPU 数量从 1192 个成功减少至 213 个,数量削减高达 82%。

这项由北京大学与阿里云合作的研究成果,被认为是“首个揭示并解决市场上并发大语言模型服务存在过高成本”的公开工作,为行业提供了全新的优化思路。

值得一提的是,阿里云首席技术官周靖人也是该论文的作者之一。周靖人是国际电气与电子工程师协会会士(IEEE Fellow),国际计算机协会会士(ACM Fellow),阿里巴巴集团副总裁,阿里云智能 CTO、达摩院副院长。

读书笔记更多>>

零跑A10首发,10万级就配激光雷达,就不传统了 静态体验别克至境世家:尺寸看齐极氪009、真龙插混更全能 上汽奥迪亮相广州车展 奥迪E5 Sportback钦定性能quattro型上市 日本汽车,还有最后一招值得中国学习 光羿科技电致变色智能调光产品斩获2025金辑奖“最佳技术实践应用奖” 冰零科技 ICE-T荣获第七届“金辑奖”2025最具成长价值奖 吉利收购雷诺巴西公司26.4%股权;威马汽车官宣“好事将近” 东风日产N7以“合资新势力”之名,携11.99万元的破局之价闯入战火纷飞的10-15万级纯电轿车市场 9月中国汽车品牌在欧洲市场份额创新高;沃尔沃汽车Q3利润超预期;欧宝考虑推出换标版零跑B10 奇瑞全固态电池,为何2030年才量产? 零跑朱江明谈跨界造车;采埃孚电驱动事业部迎新负责人 速腾聚创与导远科技达成战略合作 新石器完成逾6亿美元D轮融资 QNX全球调研:中国汽车软件开发者展现监管韧性优势,抗压能力领跑全球 塞巴斯蒂安・施密特任采埃孚电驱传动技术事业部负责人 小米汽车副总裁否认宣传“SOS 1秒接通” 安道拓推出座椅黑科技“Z-Guard安御座” LG新能源第三季度利润预计增长34% Stellantis Q3全球汽车出货量预计将同比增长13% 福特汽车任命欧洲区新任负责人,并扩大两位核心高管职责范围 赛力斯集团通过港交所上市聆讯 日本国土交通省已允许特斯拉对车辆进行软件更新,以升级其自动驾驶功能 人形机器人“价格屠夫”?大咖机器人发布新品,6.98万元起 破解具身智能数据瓶颈,枢途科技完成数千万元天使轮融资 真我将在10月21日发布年度旗舰真我GT8 Pro,该机创新性采用机械拼装设计,新机一经亮相就引发广泛关注 杨振宁用自己的一生诠释了什么是科学精神,什么是爱国情怀,什么是人生价值 阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决 AI 模型服务中普遍存在的 GPU 资源浪费问题 安世宣布中国区员工集体停薪、系统权限全面中断 AI狂热、三季度大赚,但台积电没上头 小米REDMI Watch 6手表官宣:最长24天续航,10月23日发布