2024CCF高性能计算专委算力生态战略研讨会

“2024 CCF高性能计算专委算力生态战略研讨会(CCF CES 2024，CCF Computility Ecosystem Seminar 2024)” 将于2024年8月16日举行。本次大会以“开源开放生态，编译与并行优化，学术与产业协同发展”为主题，旨在为学术界、企业界及政府部门搭建交流与合作的平台。诚挚邀请您参加此次大会！

随着人工智能技术与产业的快速发展，智能算力已成为推动新质生产力革新和产业发展的关键力量。为深入探讨人工智能算力设施，在编译工具链、共性算子库在内的基础系统软件存在诸多发展机遇与挑战，首届CCF高性能计算专委算力生态战略研讨会将于2024年8月16日在北京门头沟区举行。

研讨会安排

时间：8月16日8:00-17:30

地点：中关村（京西）人工智能科技园.智能文创园一层多功能厅

（北京市门头沟区桥园路1号）

研讨会日程

2024年8月16日
（中关村（京西）人工智能科技园.智能文创园一层多功能厅）
主持人
8:00-9:00	嘉宾签到
9:00-9:15	开幕式，领导致辞
北京市经济和信息化局领导
门头沟区政府领导
9:15-9:30	大会合影（一层大厅门口）
9:30-10:00	特邀报告1-《撼动CUDA生态壁垒的RISC-V+AI算力之路》谢涛讲席教授（北京大学）
10:00-10:30	特邀报告2-《超智融合的体系结构与编程系统》陈文光教授（清华大学计算机系）
10:30-10:45	茶歇
10:45-11:15	特邀报告3-《The Interplay among Supercomputer's Power, Resilience, and Performance》陈子忠教授（美国加利福尼亚大学河滨分校）
11:15-11:45	特邀报告4-《数学软件的智能编译与优化》阳王东教授（湖南大学）
11:45-13:30	午餐
主持人
13:30-14:00	特邀报告5-《低延迟可扩展的云原生计算系统设计》陈全教授（上海交通大学计算机系）
14:00-14:30	特邀报告6-《以数据为中心的大模型并行训练系统》李诚副教授（中国科技大学）
14:30-15:00	特邀报告7-《AI异构平台基础架构设计》张博基础设施业务群首席架构师（联想（北京）信息技术有限公司）
15:00-15:15	茶歇
15:15-15:45	特邀报告8-《神笔马良：自动化性能工程研究》王龙主任（华为北冥实验室）
15:45-16:15	特邀报告9- 《Stencil并行算法与应用优化》袁良副研究员（中国科学院计算技术研究所）
16:30-17:30	闭门会议：CCF高专委主任常委会议
参加人员：CCF高专委主任、副主任、秘书长、常委委员
17:30	结束、晚餐

（最终日程请以当天实际安排为准）

特邀报告嘉宾

谢涛

（北京大学讲席教授，CCF系统软件专委会主任、CCF会士，北京大学计算机学院软件科学与工程系主任，北京开源芯片研究院首席科学家，高可信软件技术教育部重点实验室副主任，国家高等学校学科创新引智基地负责人。）

报告主题：撼动CUDA生态壁垒的RISC-V+AI算力之路

报告摘要：近年来，RISC-V开源指令集架构快速发展，已成为当前国际科技竞争的焦点，同时也成为一个有效抓手来以开源开放凝聚产业发展共识，打造全球算力产业生态。尽管当前英伟达的GPU及其之上的CUDA软件生态主导着全球AI算力市场，但产业界迫切希望建立新的软件生态以突破CUDA生态壁垒。一个已逐渐形成的共识是以RISC-V AI芯片为共性，团结广大相关公司和高校科研院所以开源开放的方式共同制定AI扩展指令集标准，并合作研发其上的开源AI系统软件栈。本报告讨论这个方向及其面临的重大机遇和应对挑战的思路。

个人简介：谢涛，北京大学讲席教授，CCF系统软件专委会主任、CCF会士，北京大学计算机学院软件科学与工程系主任，北京开源芯片研究院首席科学家，高可信软件技术教育部重点实验室副主任，国家高等学校学科创新引智基地负责人。曾任美国伊利诺伊大学香槟分校（UIUC）计算机系正教授。当选欧洲科学院外籍院士、国际计算机学会（ACM）会士、电气电子工程师学会（IEEE）会士、美国科学促进会（AAAS）会士、中国计算机学会（CCF）会士。曾获科学探索奖，海外杰出青年科学基金，ACM China杰出学者，美国国家自然科学基金青年职业奖，ACM软件工程领域（SIGSOFT）三大国际奖项中的两项（有影响力教育工作者奖、杰出服务奖）等。担任RISC-V+AI算力生态（RACE）委员会主席，RISC-V国际基金会人工智能与机器学习技术专委会（AI/ML SIG）主席等。

陈文光

（清华大学计算机系教授）

报告主题：超智融合的体系结构与编程系统

报告摘要：大陆在超算领域取得了令人瞩目的成就，但也面临主要投资来自政府经费、主要用户来自科研院所等问题，为超算领域的进一步发展提出了挑战。另一方面，人工智能大模型的发展对训练能力提出了重大需求，国内在智能算力方面面临瓶颈。从应用层面看，除了AI大模型以外，AI 方法在科学计算问题上的应用也展示了对超智融合的需求。本报告建议发挥大陆在超算领域的技术优势，在体系结构和编程系统方面开展进一步研究，实现超智融合，提升超算投资效率、解决大陆智算算力瓶颈。

个人简介：陈文光，清华大学计算机系教授。主要研究领域为操作系统、编译器与并行计算。现为CCF会士、学术工委主任，YOCSEF荣誉委员；北京计算机学会副理事长；ACM中国理事会常务理事。

陈子忠

(美国加利福尼亚大学河滨分校教授)

报告主题：The Interplay among Supercomputer's Power, Resilience, and Performance

报告摘要：Today's supercomputers often consume megawatts level of power. While tremendous research have been done to improve applications' energy efficiency from the system point of view, few research exploits applications' algorithmic characteristics to maximize supercomputers' energy efficiency. In this talk, I will discuss our recent work on algorithmic techniques to improve applications' energy efficiency. We demonstrate that systems can not make optimal power decisions without applications' algorithmic knowledge. We investigate the interplay among application power, resilience, and performance, and demonstrate that better performance can be achieved with less power and energy when applications' algorithmic characteristics are leveraged.

个人简介：Zizhong (Jeffrey) Chen is a professor in the Department of Computer Science and Engineering at the University of California, Riverside. He is interested in high performance computing, GPU programming, distributed machine learning, and big data analytics. Collaborating with ByteDance, his group has helped to develop ByteTransformer - a GPU-based high performance Transformer that powers all of ByteDance's in house search businesses, including TikTok, Douyin, Xigua Video, Magellan, and Toutiao Search Portal, serving billions of daily active users worldwide. He has published over 150 papers with many in highly competitive conferences and journals such as SC, HPDC, ICS, SIGMOD, ICDE, PPoPP, IPDPS, TPDS, TC, TKDE, TPAMI, SIMAX, and SISC. He received a CAREER Award from the U.S. National Science Foundation and Best Paper Awards/Finalists from the IEEE International Parallel & Distributed Processing Symposium (IPDPS'23), the International Conference on Supercomputing (ICS'23), the IEEE International Conference on Cluster Computing (Cluster'18), the IEEE International Parallel & Distributed Processing Symposium (IPDPS'10) and the International Supercomputing Conference (ISC'05). Dr. Chen is a Senior Member of the IEEE and a Life Member of the ACM. He currently serves as Subject Area Editor for Elsevier Parallel Computing journal and he was Associate Editor for IEEE Transactions on Parallel and Distributed Systems from 2015-2019.

阳王东

（湖南大学二级教授，博士生导师，教育部“长江学者”）

报告主题：数学软件的智能编译与优化

报告摘要：随着对算力需求的多样化，处理器也成多样化发展。另一方面随着高性能计算已经广泛应用到社会经济当中，对数学软件的开发需求也日益增加。开发难度增加和需求增加的矛盾迫切需要一种新的数学软件开发模式，建立一套数学软件智能编译器和优化器的工具链，通过数据驱动的性能AI模型不但能提供对数学软件源代码针对目标计算平台进行编译辅助优化和自动性能调优，以快速高效适配目标计算平台，提升数学软件的计算效率。

个人简介：阳王东，博士，湖南大学二级教授，博士生导师，教育部“长江学者” 。主要研究领域为高性能计算、并行数值算法和程序性能优化，长期在天河系列国产超算平台以及飞腾、鲲鹏、海光、昇腾、景嘉微GPU等国产处理器上进行并行算法的设计和应用，主持研制了一系列的基础数值算法函数库、性能优化工具和数值模拟仿真系统。获国家科技进步二等奖，湖南省自然科学一等奖、二等奖、中国产学研合作创新成果一等奖、中国计算学会科技成果特等奖、国家教学成果二等奖和湖南省科技进步三等奖各1项，获华为火花奖2项。主持国家自然科学基金重点项目、面上项目，国家重点研发计划课题和核心技术攻关项目等国家项目，湖南省重点研发计划和揭榜挂帅等省部级项目，华为、曙光等企业委托科研项目。发表SCI/EI收录论文40多篇，其中SC、ICDE、TC、TPDS等CCF推荐的A类会议和期刊12篇，授权发明专利13项，软件著作权6项。

陈全

（上海交通大学计算机系教授）

报告主题：低延迟可扩展的云原生计算系统设计

报告摘要：云原生计算是新一代云计算的主要形态，其主要负载具有低延迟响应和高效扩展的核心需求。针对云原生中仍然存在的资源高度竞争、运行依赖复杂、扩展决策滞后的挑战，该报告将从封装方法、运行机制、扩展模型三方面介绍：1）软硬资源隔离的容器封装方法、2）去中心化触发的微服务高效执行机制、3）基于执行阻塞图模型的先验预扩展策略。基于上述方法研发了低延迟高密度的云原生运行时系统“逍遥”，提升了云原生系统效率。该系统方案集成应用于阿里云Alibaba Cloud Linux以及联想xCloud容器云平台等，应用成效显著。

个人简介：陈全，博士，上海交通大学计算机系教授，计算机系副主任。长期从事计算机体系结构、云原生计算相关的研究。主持国家优青、国家自然科学基金重点项目，并在ASPLOS，OSDI，ATC，SC，TC，TPDS，TACO等领域内著名国际会议和期刊上发表学术论文一百余篇。曾获CCF青年科技奖、阿里青橙奖等。目前担任国家自然科学基金委主办期刊Fundamental Research青年编委，领域内SCI期刊Parallel Computing、JCST、FCS编委及青年编委。研究成果曾获2023年CCF技术发明一等奖（排名第1）及国家技术发明二等奖。

李诚

（中国科学技术大学副教授/博导）

报告主题：以数据为中心的大模型并行训练系统

报告摘要：随着深度学习和自然语言处理等领域的迅速发展，大模型如GPT-3和其后继者已经成为人工智能研究的重要驱动力。然而，大模型计算需要庞大的计算、存储和网络资源，因此需要软硬协同的专门设计来满足其日益增长的算力需求。本报告介绍国家高性能计算中心（合肥）、合肥综合性国家科学中心人工智能研究院科研团队研发的分布式并行训练系统，从数据流动视角出发，提出内存、存储、通信与计算的协同优化，解决大模型训练的“内存墙”、“存储墙”和“通信墙”问题，提升了大规模并行计算的效率。该系统及关键技术已应用在微软、趋动科技、OPPO、华为、中科类脑、百度等公司的预训练和微调业务中。

个人简介：李诚，德国马普学会软件系统所(MPI-SWS)博士，中国科学技术大学计算机学院/国家高性能计算中心（合肥）长聘副教授，博导，合肥综合性国家科学中心人工智能研究院信息计算平台主任，安徽省青年教学名师、教坛新秀。聚焦大模型基础系统软件研究，在 SOSP、OSDI、EuroSys、ATC、FAST、ASPLOS、SC、HPCA等计算机系统领域著名国际会议上发表论文40余篇。长期参与SOSP、OSDI、FAST、EuroSys等会议的程序委员会。获2024年世界人工智能大会青年优秀论文奖（全球10篇）、2023世界人工智能大会云帆奖璀璨明星（全球10人）、2023年阿里巴巴优秀合作项目奖（全国15个）、2022 AI 2000 计算机系统领域最具影响力学者提名、2022 CCF分布式专委杰出青年学者、2021 ACM中国新星提名等10项科研奖励。主讲《编译原理和技术》课程入选第二批国家级线下一流课程，获安徽省第五届青教赛工科组一等奖等10余项教学奖励，主编安徽省精品教材。

张博

（联想（北京）信息技术有限公司基础设施业务群首席架构师）

报告主题：AI异构平台基础架构设计

报告摘要：随着AI算力单元的快速发展，同传统的HPC场景相比，算力单元呈现多样化的发展趋势。目前国内很大部分的智算用户是同时具有超算和智算需求的，用户会越来越频繁的遇到异构算力的调度和管理难题。

而在快速爆发的AI需求中，同时异构算力也将越来越多的出现在模型训练的场景中。如何能够将数十种的硬件算力资源和上百种的场景需求相结合，最大化提高算力效率，降低无效计算，提升模型训练的并行性，是AI异构平台基础架构设计所要解决的主要问题。

AI异构算力平台架构设计能够有效解决用户所面临的以上难题，统一管理调度超算/智算的算力资源，同时在算力需求更复杂的AI场景中，协调调度不同种类的算力单元，提升系统的综合计算能力，降低算力单元异常对系统训练的影响，提高训练效率。

个人简介：张博，联想集团基础设施业务群首席架构师，智算中心业务首席专家，气象海洋等领域行业资深专家，对超算/智算基础架构设计有深入研究，擅长超算系统算力设计，对超算/智算的网络架构设计，高性能存储系统设计等方面有独到见解，参与设计北京冬奥气象预报系统、国家海洋高性能预报系统等气象、海洋领域标杆项目、多个智能制造邻域标杆项目，以及多个区域性超算/智算中心项目。

王龙

（华为北冥实验室主任）

报告主题：神笔马良：自动化性能工程研究

报告摘要：随着国产处理器的兴起，同一份用户代码往往需要开发多个版本，并花费大量的时间去做新处理器的性能优化。我们认为这显然拉长了用户开发新算法的迭代周期，也影响了国产处理器的普及推广。如何让用户把更多的精力放在发明创造应用算法本身，是我们研发“神笔马良”的核心动力。

为了实现“自动地为用户生成优化后的代码”这一目标，我们系统地定义了HPC重点领域的可加速算子（应用级而非传统的数学库），并实现了从代码自动识别这些算子的功能，同时基于华为处理器进行了高效后端实现。我们会在报告中介绍这一自动化工作的主要原理、加速结果和未来的展望。

个人简介：王龙有十余年高性能计算、特别是超算应用的相关研究经历，主要工作包括：1）中科院超算中心期间主持千核-万核-十万核超大规模重点应用研发项目，发展了一大批高性能计算应用，为大陆的超算应用发展起到推动作用，并获北京市科技进步一等奖。他同时也是国内首个gpu算法研究国际会议主持者，地球系统数值模拟装置的早期研究者和推动者等；2）在百度期间担任系统部技术委员会主席，研究编译技术与性能优化结合的交叉方向；3）在华为期间负责计算系统优化实验室（简称北冥），主要基于华为处理器，开展面向HPC、AI、通用计算领域的性能优化、性能可移植及软硬件协同设计研究。是“神笔马良”这一HPC领域自动应用优化工具的主要发明人。

袁良

（中国科学院计算技术研究所副研究员）

报告主题：Stencil并行算法与应用优化

报告摘要：Stencil是一种重要计算模式，常见于大规模并行科学和工程应用中，也是计算机并行算法和编译技术的重要研究对象，介绍Stencil并行算法以及面向WRF应用的优化技术。

个人简介：袁良，中国科学院计算技术研究所，副研究员。主要研究方向为大规模并行应用优化、并行算法和并行计算模型，相关成果发表在SC、PPoPP、TPDS、TACO、ICS、IPDPS上。

大会组委会特别邀请对算力、高性能计算、大数据等核心问题感兴趣或有经验、有想法的专业人士参加。大会已开放注册，请扫描或识别下面的二维码报名参会。

扫描大会二维码报名

门票类型	参会者身份	7.5-8.15
会议注册费	CCF会员	1600
非会员	2000

参会指南

交通指南

住宿指南

周边酒店：喆.啡酒店（北京门头沟科技园上岸地点站店）距会场：2.3公里

协议价格：438元/间（啡凡大床房）含早、478元/间（啡凡景观大床房）含早

酒店联系人/联系方式：王猛 / 13810985224

酒店预定方式：联系酒店联系人进行预定（*报计算机会议，享受协议价格）

酒店地址：门头沟区石龙经济开发区雅安路6号利德衡大厦3幢1楼电话：010-60806410、010-60806420

周边酒店：北京门头沟上岸地铁站MUSTEL木文缇酒店距会场：2.5公里

协议价格：350元/间（大床房）含早

酒店联系人/联系方式：张苏安琪 / 13681224022

酒店预定方式：联系酒店联系人进行预定（*报计算机会议，享受协议价格）

酒店地址：门头沟区曹各庄中路15号院1号楼一楼

*安排会场接驳车

赞助单位：联想集团

大会主页：https://ccf.org.cn/ccfces2024

会议联系人：李希代 13693056420 [email protected]

2024CCF高性能计算专委算力生态战略研讨会

继续阅读

这场直击充换电痛点的大会值得关注！2024中国汽车充换电生态大会前瞻来了

原生态、工业风、网红店……闵行这个新地标商圈去过吗→

最高获奖2万元！生态环境部公布举报奖励典型案例

龙芯大秀工业生态成果：73家新品齐发、开源鸿蒙好朋友

走！“探秘”生态环境监测实验室

南沙和华为强强联手！共建人工智能生态基地

与洱海，共未来！2024推进全球生态文明建设（洱海）论坛开幕

回归自然！躲进隐匿山野的生态秘境，氧气值爆表！

蓉城智碳丨共学“巴适之地”的生态故事

未来之瞳科学公园预计年底建成投用持续释放生态科创魅力

关注秸秆综合利用 | 南乐县：秸秆利用让“生态包袱”变“黄金财富”

中央第一生态环境保护督察组向我省移交第一批次信访事项

Redmi显示器G27Q多功能支架版2025发布；OPPO磁吸生态配件公布

着眼生态旅游的多维视角与创新发展，第二届数字文旅高峰研讨会在崇明举行

动物界的“造粪冠军”：河马粪便的生态影响之谜。

面积近60000㎡！闵行这个生态休闲林地升级啦