厦门市智能存储与计算重点实验室两篇论文被SC'25接收,一篇获最佳学生论文提名
发布时间:2025-07-14 点击:

近日,高性能计算领域国际顶级会议SC 2025(International Conference for High Performance Computing, Networking, Storage, and Analysis) 公布了论文录用结果,厦门市智能存储与计算重点实验室2篇论文被录用,其中一篇获得了最佳学生论文提名。SC由美国计算机协会(ACM)与美国电气电子工程师学会(IEEE)于1988年共同创办,是全球高性能计算领域公认的年度顶级盛会,是中国计算机学会CCF推荐的A类国际会议。SC 2025会议共收到643篇投稿,接收136篇,录用率21.2%。

1. Phoenix: A Refactored I/O Stack for GPU Direct Storage without Phony Buffers

英伟达GDS(NVIDIA GPU Direct Storage)通过PCIe P2P-DMA在GPU与存储设备之间建立直接数据I/O通路,可降低GPU访问存储的延迟与CPU开销,提升数据传输效率。然而,目前的GDS在主机内存中使用phony buffer与Linux内核交互,导致I/O性能不佳、资源消耗增加以及部署复杂度较高。

图1 Phoenix 总体架构图

针对上述问题,本研究为GDS重新设计了I/O软件栈(Phoenix),在I/O路径上完全消除了phony buffer。Phoenix利用Linux ZONE_DEVICE内存映射服务,在系统启动时将GPU内存映射进页表,进而保存返回的地址信息,分配用户空间虚拟内存,并建立与目标GPU内存的映射关系。与GDS I/O栈相比,Phoenix可将关键I/O路径上的软件处理开销平均降低70.3%,小I/O性能(如KV缓存)与大I/O性能(如检查点)分别提升2.29倍与4.11倍。

该论文共同第一作者为信息学院硕士生严建勤和博士生仇实,通讯作者为张一鸣教授,由信息学院吕熠娜助理教授、硕士生胡意凡、硕士生陈浩、沈志荣教授、姚信(华为技术有限公司)、陈仁海(华为技术有限公司)、张弓(华为技术有限公司)和舒继武教授共同完成。目前,该工作已经成功适配华为昇腾系列NPU计算卡。

2. MetoHash: A Memory-Efficient and Traffic-Optimized Hashing Index on Hybrid PMem-DRAM Memories(最佳学生论文提名)

持久性内存(Persistent Memory)具备非易失性和字节寻址的特性,提供接近DRAM性能的同时具有更高的存储密度,弥补了现有存储架构中DRAM和磁盘之间的巨大鸿沟。哈希索引具有常数级的读写时间复杂度,因此被广泛应用于内存数据库和键值存储等场景中。然而现有的持久性内存上的哈希索引存在内存利用率低和流量放大的问题,加剧了持久性内存的寿命损耗。

图2 MetoHash 总体架构图

基于此,本研究提出了一种跨越缓存、DRAM和持久性内存三层的内存高效和流量优化的哈希索引,首先在CPU的缓存中聚合哈希索引的插入操作,并选择性地将聚合后的数据刷写至DRAM和持久性内存中以减少写放大流量;同时本研究在DRAM中维护了一个小型索引结构和指纹表以在保持高内存利用率的同时减少读写放大。与现有的持久性内存上的哈希索引研究相比,本研究在不同的工作负载下平均提升了86.1%-257.6%的吞吐量。

该论文共同第一作者为信息学院硕士生余子祥和硕士生邓光阳,通讯作者为沈志荣教授,由信息学院硕士生苏强生、博士生吴镕龙、硕士生胡心彬、王晓黎副教授、徐泉清(蚂蚁集团)、杨传辉(蚂蚁集团)、鲍芝峰(昆士兰大学)、张一鸣教授和舒继武教授共同完成。