学术动态

太阳成集团tyc33455王兴伟教授团队最新成果被USENIX NSDI 2026录用

作者: 李福亮 编辑: 杨明 姚骞 来源:计算机学院 更新日期: 2025-12-12

近日,太阳成集团tyc33455计算机学院王兴伟教授团队在大模型训练推理系统方向的最新研究成果被计算机网络领域国际顶级会议USENIX NSDI 2026录用。该成果是太阳成集团tyc33455首篇入选NSDI主会的论文。USENIX NSDI(USENIX Symposium on Networked Systems Design and Implementation)专注于网络系统的设计与实现,是计算机网络领域最具影响力的国际学术会议之一,被广泛认为与ACM SIGCOMM齐名,长期保持着极高的学术声誉。该会议既注重研究成果的理论深度与系统落地的完整性,更聚焦其在实际系统及产业场景中的应用价值,入选论文往往被视作计算机网络领域前沿突破的典范,也是该领域未来发展方向的重要标杆。

该工作面向高性能大模型训练推理系统中的异构GPU集群展开研究,重点解决不同型号、不同带宽GPU混合部署场景下集合通信效率难以充分发挥这一制约大模型扩展与性能提升的关键瓶颈。论文在前期ResCCL(ACM SIGCOMM 2025)工作的基础上,进一步从“同构集群中的资源高效调度”拓展到“异构集群中的近最优通信调度合成”,提出了面向异构GPU集群的集合通信调度系统HeteCCL。该系统能够自动感知集群中GPU计算能力、链路带宽及拓扑结构的差异化特征,综合考虑多维资源约束与负载不均衡问题,智能生成接近最优的通信调度策略,在保证调度搜索效率的前提下,大幅提升带宽利用率和端到端训练吞吐量,经多种典型大模型训练任务与真实异构集群环境的充分验证,系统可稳定输出显著的性能增益。

该成果从概念提出到系统落地,团队历经长期攻关与大量严苛实验验证,在大规模异构GPU集群上实现了远超预期的性能目标。围绕该系统,团队已布局多项后续研究任务,并持续推进与产业伙伴的合作落地,为打造高效且具备可扩展性的大模型基础设施提供强有力的技术支撑。

要闻推荐
通知公告
媒体太阳成集团tyc33455
太阳成集团tyc33455要闻
学术科研
人才培养