天天看點

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

作者:CCFvoice

由CCF主辦,CCF分布式計算與系統專委會與吉林大學承辦的CCF分布式計算大會(CCF Computility 2024) 暨全國開放式分布與并行計算學術年會(DPCS 2024) 将于2024年7月26日至28日在中國吉林省長春市舉行,會議規模預計1000餘人。本次會議主題為“算力網:新質生産力背景下的分布式系統”,旨在為分布式系統和算力網相關的從業者提供最專業的學術研讨、技術交流和成果展示的平台。CCF Computility 2024為大家準備了9場由院士等頂級專家帶來的主旨報告,15場技術論壇(80位特邀報告),絕對不容錯過!

CCF Computility 2024 | 學術盛宴,大咖雲集,不容錯過!

大會主旨報告嘉賓

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

論壇背景

本論壇專注于探讨算力網絡存儲領域最新技術創新。本論壇将聚集來自學術界和工業界的專家學者、研究人員和從業者,深入探讨算力網絡新範式,展示雲網邊資源動态配置設定的最新成果。通過案例分析,突顯高效能計算與存儲的協同優化,以解決資料密集挑戰。同時,關注綠色可持續性,讨論節能減排政策,引領算力網絡向環境友好型轉變。本論壇旨在搭建開放交流平台,促進産學研各界的密切合作,共同探索算力網絡存儲技術的新邊界,推動數字經濟高品質發展。

算力網絡存儲創新技術論壇報告安排
論壇主席 張廣豔教授、蔣德鈞副研究員
特邀報告1 張廣豔 CCF資訊存儲技術專業委員會副主任、CCF計算機曆史工作委員會副主任、清華大學長聘副教授 編碼存儲系統:架構、理論與方法
特邀報告2 華宇 華中科技大學教授 大記憶體系統的分布式事務機理
特邀報告3 張一鳴 廈門市智能存儲與計算重點實驗室教授 面向算力網絡的可靠存儲關鍵技術
特邀報告4 吳忠傑 阿裡雲資深技術專家 新型高效能分布式存儲系統助力算力網建設
特邀報告5 顧榮 南京大學特聘研究員 面向雲原生算力的彈性緩存研究及其開源應用
特邀報告6 單一舟 華為雲架設部架構師 建構面向大規模推理的分離式資料中心
特邀報告7 張傑 北京大學助理教授 近資料計算的進展與展望
特邀報告8 蔣德鈞 中科院計算所副研究員 面向差異化需求的分布式存儲系統QoS保證

時間:2024年7月27日 下午

地點:吉林省長春市安華假日宴會中心宴會廳A

論壇主席及介紹

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

張廣豔

清華大學

張廣豔,CCF資訊存儲技術專業委員會副主任、CCF計算機曆史工作委員會副主任,清華大學計算機系長聘副教授,國家傑出青年科學基金獲得者。主要從事大規模資料存儲與分析的理論和方法研究,包括存儲系統、資料壓縮、大資料計算、AI計算系統等方面。研究得到包括國家傑出青年科學基金、國家重點研發計劃、中國工程院戰略研究與咨詢項目、973和863等國家科研項目的支援。發表學術論文60餘篇,其中包括FAST、SOSP、USENIX ATC、EuroSys、ACM TOS、IEEE TC、IEEE TPDS等計算機系統領域頂級國際會議和期刊論文20餘篇。以第一發明人獲得美國發明專利授權、中國發明專利授權10餘項。研究成果應用到多家國内骨幹企業的存儲産品中,效果良好。指導的研究所學生獲得“清華大學優秀碩士學位論文”獎、“鐘士模獎學金”、“西貝爾學者”等榮譽。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

蔣德鈞

中國科學院計算技術研究所

蔣德鈞,博士,中科院計算所副研究員,博士生導師,中科院計算所先進計算機系統研究中心資料系統實驗室主任。主要研究興趣包括存儲系統軟體與體系結構,作業系統,分布式系統等,在ATC, TACO, MSST, ICDCS等國際會議與期刊上發表論文三十餘篇。承擔或參與多項國家重點研發計劃項目,國家青年科學基金項目,人社部留學人員科技活動優秀項目,北京市自然科學基金項目等。曾獲中國科學院青年創新促進會項目資助,北京市科學技術進步獎二等獎,CCF科技進步獎三等獎。

嘉賓及報告介紹

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

張廣豔

清華大學

張廣豔,CCF資訊存儲技術專業委員會副主任、CCF計算機曆史工作委員會副主任,清華大學計算機系長聘副教授,國家傑出青年科學基金獲得者。主要從事大規模資料存儲與分析的理論和方法研究,包括存儲系統、資料壓縮、大資料計算、AI計算系統等方面。研究得到包括國家傑出青年科學基金、國家重點研發計劃、中國工程院戰略研究與咨詢項目、973和863等國家科研項目的支援。發表學術論文60餘篇,其中包括FAST、SOSP、USENIX ATC、EuroSys、ACM TOS、IEEE TC、IEEE TPDS等計算機系統領域頂級國際會議和期刊論文20餘篇。以第一發明人獲得美國發明專利授權、中國發明專利授權10餘項。研究成果應用到多家國内骨幹企業的存儲産品中,效果良好。指導的研究所學生獲得“清華大學優秀碩士學位論文”獎、“鐘士模獎學金”、“西貝爾學者”等榮譽 。

報告題目:編碼存儲系統:架構、理論與方法

報告摘要:相對于多副本存儲,編碼存儲顯著降低了資料備援開銷。然而,編碼存儲仍然面臨一些主要問題,包括但不限于:資料恢複速度慢、部分條帶寫性能低以及快速裝置上性能不穩定。為了解決這些問題,我們提出了一種資源全局共享的存儲架構,旨在提高資料恢複和資料讀寫過程中的内部資料讀取、傳輸、計算和寫入速度。然而,在實施上述架構時,我們還需要應對一些理論和方法層面的挑戰,包括細粒度資料布局管理、大規模恢複任務排程以及兼顧中位延遲的長尾延遲優化。在本報告中,我們将共同探讨這些問題、挑戰以及初步的解決方案。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

華宇

華中科技大學

華宇,華中科技大學教授,國家傑出青年科學基金獲得者,CCF傑出會員和傑出演講者。主要研究新型存儲器件、高性能存儲系統和安全架構。在OSDI、ASPLOS、MICRO、FAST、HPCA等會議上發表多篇學術論文。在ICDCS 2021、ACM APSys 2019等國際會議上擔任程式主席/副主席,在OSDI、SIGCOMM、FAST、NSDI、MICRO、ASPLOS、EuroSys等國際會議上擔任程式委員,是ACM Transactions on Storage期刊的編委。研究成果獲得教育部自然科學一等獎等3項省部級科技獎勵,以及FAST 2023等4項國際會議和期刊的最佳論文獎。

報告題目:大記憶體系統的分布式事務機理

報告摘要:具有大容量、高性能、非易失等特點的大記憶體系統是算力網絡的重要組成部分,其體系結構包括一體化記憶體、互聯記憶體、池化記憶體等多種形式,而其分布式事務處理機制是影響算力網絡整體性能的關鍵所在。報告将全面系統地闡述支援算力網絡的大記憶體系統的分布式事務機理,并在資料模式、更新機制、網絡協定、版本管理等方面介紹相關的工作進展,為未來大記憶體系統的進一步發展提供思路。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

張一鳴

廈門市智能存儲與計算重點實驗室

張一鳴教授目前主要從事雲計算和AI計算系統研究,成果在天河超算、華為雲等關鍵業務系統中得到應用。擔任中國計算機系統大會(ChinaSys)主席、IEEE Transactions on Computers編委、歐洲計算機系統優秀博士論文評獎委員會委員、IEEE JointCloud國際會議主席。獲國家科技進步二等獎、湖南省自然科學一等獎、CCF優博論文獎、CCF科技進步卓越獎等。

報告題目:面向算力網絡的可靠存儲關鍵技術

報告摘要:高效可靠的資料存儲是算力網絡的關鍵。本報告分别針對算力網絡的兩個重要場景,AI計算和虛拟化計算,介紹我們的最新研究成果。首先,高帶寬記憶體(HBM)的可靠性是AI計算面臨的重要問題之一。我們對生産環境中的海量HBM故障日志進行分析,總結其特點,進而提出有效的預測方法。第二,KVM(基于核心的虛拟機)是Linux上主要的VM管理程式,它遵循标準virtio架構來對客戶VM的I/O裝置進行半虛拟化。傳統上,KVM依賴QEMU來實作virtio裝置族的後端,比如virtio-blk/-net,其中KVM(核心空間)和QEMU(使用者空間)之間的協作是實作安全靈活存儲管理(如遷移)的關鍵。我們對高效協同的虛拟化存儲技術進行研究,顯著提高了半虛拟化的效能。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

吳忠傑

阿裡雲

吳忠傑,花名儲道,阿裡雲資深技術專家,中國計算機學會存儲專業委員會執行委員。長期從事資料存儲技術研究與開發,近年來參與ZNS國際标準提案,在閃存存儲,軟硬協同分布式存儲系統方面做了一些工作。

報告題目:新型高效能分布式存儲系統助力算力網建設

報告摘要:資料存儲是算力網建設過程中的重要環節,算力網對存儲系統的容量、性能和效能都提出了重要的技術挑戰。需要采用軟體定義存儲的思想,通過軟硬協同設計的方法提升分布式存儲系統的效能,滿足算力網對資料存儲的需求。本報告将從問題分析切入,提出針對算力網建設的高效能分布式存儲系統設計的一些方法,展示新型存儲系統給業務帶來的價值。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

顧榮

南京大學

顧榮,南京大學特聘研究員/博導,國家高層次青年人才計劃入選者,達摩院青橙獎獲獎者(2023),主要研究方向為雲計算與大資料系統、分布式存儲管理系統,發表領域研究論文60餘篇,包括USENIX ATC, EuroSys, VLDB, KDD, ICDE, WWW, VLDBJ, IEEE TPDS, TKDE, TON等。主持國家自然科學基金面上/青年項目、國家重點研發計劃子課題、中國博士後科學基金特别資助項目,以及中國石化、中國中車、中國移動、華為、阿裡、中興、騰訊、位元組跳動等企業創新基金項目等10餘項,獲江蘇省科學技術一等獎、IEEE TCSC Award for Excellence (Early Career Researcher)、IEEE HPCC會議最佳論文獎、CCF分布式計算與系統專委會青年創新先鋒、阿裡優秀學術合作項目獎、華為公司火花獎、中興産學研優秀合作項目獎、騰訊雲最具價值專家獎、中國開源創新大賽一等獎,擔任雲原生計算基金會Fluid開源社群主席。

報告題目:面向雲原生算力的彈性緩存研究及其開源應用

報告摘要:随着以大模型為代表的AI技術的興起,越來越多資料密集型應用(AI模型訓練、大資料查詢等)運作于成本經濟節約、算力編排靈活、系統運維便利的雲原生平台。然而,雲原生存算分離與資源彈性的架構特點對傳統緩存技術提出了巨大挑戰。本報告将介紹一種智能彈性緩存技術,包括輕量精準緩存容量調整,緩存算力協同排程,以及緩存副本高效傳輸等核心方法。進一步,我們将分享基于上述技術研制的Fluid開源項目(已入選雲原生計算基金會)及其行業領軍型企業的應用成效。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

單一舟

華為

單一舟,華為雲架設部架構師, 博士畢業于加州大學聖地亞哥分校。研究方向圍繞提升資料中心基礎設施成本效益,包括大模型推理系統,分離式記憶體,大規模分布式存儲系統等。在華為雲主導雲存儲硬體加速和Serverless大模型推理項目。在頂級學術會議發表論文20+,研究曾獲得OSDI 2018, SYSTOR 2019,FPAG 2024 Runner Up最佳論文。

報告題目:建構面向大規模推理的分離式資料中心

報告摘要:基于LLM的大模型推理正成為資料中心最重要的負載之一。大模型推理呈現出多變多樣的特征,對資料中心底層基礎設施提出了非常高的新需求。本次報告主要讨論如何提升大模型推理在大規模部署時的成本效益。報告先闡述目前資料中心推理部署架構,并從模型結構出發分析模型與硬體之間的不比對,總結為Model Serving的三堵牆,即記憶體牆, 排程牆,以及彈性牆,進而闡述業界解決這些瓶頸的方法。報告也會讨論Agent Serving的部署形态和挑戰。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

張傑

北京大學

張傑,博士,北京大學計算機學院助理教授、博士生導師、特聘研究員,入選國家高層次人才計劃海外青年項目,獲得英特爾中國學術英才計劃榮譽學者、ACM SIGCSE新星獎。長期從事存儲系統和專用處理器的研究和設計,緻力于從計算機體系結構層面出發,解決大資料和人工智能時代對于高性能存儲系統的需求,突破馮諾依曼體系結構下資料遷移的瓶頸以及記憶體牆的限制。在國際會議及期刊上發表了50餘篇論文,包括計算機體系結構與系統頂級會議ISCA(CCF-A,三篇)、OSDI(CCF-A)、 HPCA(CCF-A,七篇)、 MICRO(CCF-A,兩篇)、ASPLOS(CCF-A)、FAST(CCF-A)、ATC(CCF-A,兩篇)、Eurosys(CCF-A)。

報告題目:近資料計算的進展與展望

報告摘要:随着大資料時代的到來,人工智能、圖計算、大資料等新型應用對伺服器叢集的算力和存儲能力提出了更高的要求。然而,傳統的馮諾依曼體系結構及配套的系統軟體存在資料遷移開銷大的天然劣勢,無法滿足新型應用的實際需求。當今的記憶體和存儲系統正經曆了重大的技術轉變。基于這種技術的提升,研究人員需要重新思考和設計現有的系統組織和硬體架構。本次報告主要分享我們在近資料計算領域的研究進展,我們提出的解決方案能夠有效減少大量軟體棧的開銷并且優化計算機體系結構消除傳統硬體的實體限制。

張廣豔教授、華宇教授和張一鳴教授邀你共話算力網絡存儲創新技術

蔣德鈞

中國科學院計算技術研究所

蔣德鈞,博士,中科院計算所副研究員,博士生導師,中科院計算所先進計算機系統研究中心資料系統實驗室主任。主要研究興趣包括存儲系統軟體與體系結構,作業系統,分布式系統等,在ATC, TACO, MSST, ICDCS等國際會議與期刊上發表論文三十餘篇。承擔或參與多項國家重點研發計劃項目,國家青年科學基金項目,人社部留學人員科技活動優秀項目,北京市自然科學基金項目等。曾獲中國科學院青年創新促進會項目資助,北京市科學技術進步獎二等獎,CCF科技進步獎三等獎。

報告題目:面向差異化需求的分布式存儲系統QoS保證

報告摘要:算力網場景中,不同QoS需求的延遲敏感型租戶與帶寬型租戶混部共享底層分布式存儲系統。由于資源共享存在幹擾,導緻租戶SLO難以保證、資源使用率低等問題。分布式存儲系統後端存儲的架構不同,在面臨上述問題時的瓶頸點也不相同。本報告将探讨上述問題和挑戰,分析不同後端存儲架構的瓶頸點,并介紹針對SEDA架構和RTC架構的QoS保證技術,旨在保證租戶SLO的同時最大化系統資源使用率。

會議注冊方式

1.注冊标準

門票類型 參會者身份 6.1~7.28
會議注冊費 CCF專業會員 ¥2700
CCF學生會員 ¥1700
非會員專業人員 ¥3200
非會員學生 ¥2200

2.報名方式

會議注冊二維碼 大會首頁二維碼

說明:本次會議通過CCF會議管理系統繳費,退費遵守《CCF關于會議注冊費的退費規定》。

以上論壇具體安排,請關注大會官網。除主旨報告和本論壇之外,CCF Computility 2024還組織了14場别開生面的專題論壇,每一場都有頂級專家擔論壇主席,為大家帶來最前沿的學術讨論和技術交流。

目前大會籌備工作接近尾聲,歡迎廣大對分布式計算感興趣的領域學者莅臨長春,共同見證和推動技術創新。

繼續閱讀