中国算力大会丨新华三集团副总裁、解决方案部总裁李立:攻关算网新技术,推动算力均衡发展
发布:2022-07-31 阅读:523
在2022中国算力大会上,紫光股份旗下新华三集团副总裁、解决方案部总裁李立出席主论坛并发表演讲,分享了新华三集团对算力与网络融合背景下技术发展趋势的深度洞察。
今年2月,“东数西算”工程正式启动,我国算力基础设施建设步伐进一步加快,但随着算力应用场景持续拓展、数据规模爆炸式增长、算法复杂度不断提高,产业发展面临的挑战也不断攀升。李立表示,算力产业主要面临着日益增长的行业智能化需求和不均衡、不充分的算力发展间的矛盾,应从芯片级、设备级、集群级、地域级4个维度寻找突破口,通过核心技术攻关解决从芯片到广域的IO不均衡问题,助推算力产业高质量发展。
在芯片级,李立指出,多芯片堆叠封装为芯片突破性能瓶颈提供了可能,另一方面,“存算一体”的发展思路可以有效平衡计算和内存的配比,缩短数据搬运路径,降低搬运功耗,实现芯片级算力与IO的平衡,为算网融合构建算力基石。新华三集团未来将携手业界积极推进相关标准建设,以实现片内算力和片间互联的均衡发展。
在设备级,当前,以扩展总线的Scale-out模式换取IO提升,成为设备算力提升的有效手段,例如PCIe Switch、CXL Switch、NV Switch、NVMe over Fabric等,业界已经开始尝试多种总线互联和扩展技术,从内存、GPU、存储等多个角度入手,从互联设计角度出发,对资源进行分布式池化设计,从而平衡数据IO和计算密度。
在集群级,李立表示,算力拓扑是构建高性能算力中心的关键环节,运用AI技术和网络设备的在网计算能力,可以实时收集并分析组网、设备、流量等综合信息,并通过强化学习对业务流量模型进行算力拓扑规划和动态调整,从而保障算力拓扑始终处于最优状态,满足大规模计算集群的部署需求。新华三集团近年来不断迭代组网拓扑,以期实现大规模算力部署和高性能数据中心网络的均衡,满足算力扩张需求。
在地域级,李立认为,确定性服务是广域算力互联及调度的关键点,在实际应用中具备诸多优势。在网络传输层面,通过引入确定性网络技术,可以保证网络层面全方位确定性传输,数据跨区域传输时延确定可控;在算力调度层面,通过分布式算网大脑统筹考虑可用算力容量、成本、网络传输效率等多维属性,可以为客户提供确定性有保障的服务。
算力与网络的融合发展是大势所趋,只有把握好算网融合新趋势,加强算网核心技术攻关,同时构建产业生态形成发展合力,才能更快更好地建成高质量算力网络,让算力成为普惠大众的生产力,进而推动百行百业数字化转型进程,促进我国数字经济的稳步健康发展。