天天看點

趙世振 | 光電混合資料中心研究的行路者

作者:科學中國人scichi

近些年,“人工智能”“大資料”等詞語早已被人們所熟知。

可随着人工智能、大資料處理、高性能計算等應用對算力的需求不斷增長,資料中心的網絡帶寬已逐漸成為其算力增長的瓶頸。為了消除網絡瓶頸,科學家想了不少辦法。

第一種方法是通過堆疊交換機裝置的方式來提升資料中心的網絡帶寬;第二種方法是采用更高容量和帶寬的交換晶片。

但這兩種方法均會大幅增加網絡功耗,并且高端晶片還受到美國限購政策的制約。

除此之外,還有第三種方法,就是設計光電混合資料中心,用高帶寬、低功耗的光交換機替換高功耗的電交換機,在不增加網絡功耗的前提下提升網絡性能。

“前面的兩種方法成本太高了,隻有第三種方法的成本可以接受,但要做成也十分不容易。”上海交通大學長聘教軌副教授、博士生導師趙世振解釋說,因為前人設計的光電混合網絡對光交換硬體的切換時延和網絡控制器的收斂速度要求極高,難以真正落地。

趙世振 | 光電混合資料中心研究的行路者

▲趙世振

面對這樣的狀況,趙世振和他的團隊一直在為如何設計和控制光電混合資料中心而努力着,他一直以推動光電混合資料中心的落地應用為自己的研究目标。在國内,這還是一條獨特的、頗具挑戰的新道路。

路,道也

大學時期的趙世振其實和很多人一樣,并不知道自己應該做什麼領域。

2010年,趙世振從上海交通大學電子資訊與電氣工程學院畢業。之後,他于2015年從美國普渡大學電子與計算機工程專業畢業,獲博士學位。

在這段充實而又漫長的求學日子裡,趙世振做得更多的是關于理論分析的内容,他把這段經曆比喻為“内功修煉”,“我對數學是十分喜歡的,是以選擇了做網絡理論方面的研究。從我的導師那裡我也學到了很多東西”。

面對理論學習,趙世振絲毫不覺得枯燥,反而覺得收獲巨大。“如果沒有紮實的‘内功修煉’,後續遇到的現實問題我可能也解決不了。”

但在這段理論學習的過程中,趙世振也遇到了一些困惑。

“我意識到理論想應用需要别人配合,但别人可能因為不懂你的理論而不會去配合。如果自己能在理論和應用兩方面都做好,就不存在這個問題了。”

因為這個想法,趙世振在博士畢業後,選擇先去工業界——他進入美國谷歌網絡組工作。

對于剛剛走出象牙塔的學生來說,這是一條未知且全新的道路。

在谷歌工作的幾年時間裡,趙世振真正從理論中走出來,正式開始在資料中心這個方向上深耕細作。

工作中一點點積累起來的寶貴經驗讓他意識到在實踐中發現問題的重要性,而趙世振此前打下的紮實基礎,也為他後來解決更多的問題提供了助力。

他意識到理論分析和做系統之間是可以互相結合起來的。就這樣,一條新的道路開啟了。

在谷歌工作時,趙世振逐漸意識到光交換對資料中心的重要性——能有效降低運維難度,是以他提出利用光交換機加速資料中心的擴容。

通過在胖樹架構資料中心的彙聚層與核心層之間引入光交換機,趙世振巧妙地将擴容過程中的人工拓撲重連轉化為光交換機的自動重配。

此外,他還提出一個全新的變量合并技術,使拓撲重構的計算複雜度大幅降低。

這一成果使資料中心的自動化擴容成為可能,不僅能大幅縮短擴容所需時間,還能降低出錯機率。

這項成果于2019年發表在網絡系統的國際頂級會議——網絡系統設計與實作專題讨論會(NSDI)中。

2019年,趙世振回國,加入了上海交通大學約翰·霍普克羅夫特計算機科學中心,開始從事光電混合資料中心網絡架構的研究。

光電混合資料中心網絡架構的研究屬于網絡系統,與“人工智能”等熱門方向相比,網絡系統的研究雖然在業界也有較強的需求,但由于研究周期長、出成果慢,願意從事這個方向的人并不多。

“AI領域可以幾個月出一篇論文,而網絡領域的一篇論文要1~2年。”

那如何讓更多優秀的學生加入呢?趙世振采取了一種類似“姜太公釣魚”的方式,他在上課的時候會有針對性地做一些課程的設計,通過這些獨特的課程設計來吸引有想法的、優秀的學生加入。

多年來,趙世振在求學與工作中積累了豐富的經驗,再加上精挑細選的團隊,所有的一切都為接下來的科學探索打下了良好的基礎。接下來,便是朝着理想中的目标,投身研究。

撼大摧堅,徐徐圖之

盡管光電混合資料中心在技術層面存在諸多難題,但趙世振依然充滿了信心。

“在硬體方面,光交換器件切換時延高、靈活性差。而在軟體方面,光電混合資料中心的控制方案,包括拓撲、路由算法目前比較缺少,舊的電交換Clos資料中心網絡已經很成熟,而光電混合資料中心網絡還比較新。”

面對這些難點,趙世振及其研究團隊專注于利用軟體來彌補硬體的缺陷,開展相關研究工作。

除了研究上遇到的困難以外,趙世振及其研究團隊在推動光電混合資料中心的落地應用方面也并不輕松。

正如趙世振所說,想讓光電混合資料中心應用落地不僅需要漫長的時間和足夠的耐心,還要根據實際的需求不停找出解決辦法。

不過,相較于一味地追求速度、與他人進行無效的競争,趙世振和研究團隊選擇穩紮穩打,一步步實作自己的目标。

本着這樣的初心和努力,在2021—2022年,趙世振和研究團隊在光電混合資料中心網絡架構的設計與優化研究方向取得了多項創新進展。

針對光電混合資料中心的運作過程,他們首次提出“慢切換”的控制方式,大幅降低了光電混合資料中心的控制難度以及對快速光交換硬體的依賴。針對光電混合資料中心搭建初期的容量規劃,他們首次提出“競争比”概念,能夠在不知道資料中心流量模式的前提下嚴格分析光電混合資料中心實體拓撲的性能。

其中第二個成果論文被發表在美國計算機協會計算機系統測量和模組化學會舉辦的年度會議(ACM SIGMETRICS)中,這是上海交通大學作為第一作者機關在這一會議的首篇論文。

對于趙世振和其研究團隊來說,這篇論文不僅是重要的成績,更是繼續前進的鼓勵。多年的研究,在趙世振和其團隊的一步步推動下,終有所成。

不啻微芒,造炬成陽

即便是微弱的光芒,若能積少成多,也會成為閃耀的太陽。

時間來到了2022年8月,一個好消息為趙世振和研究團隊帶來了一份意料之外的喜悅。

谷歌首次公布了他們的光電混合資料中心架構,裡面的控制算法深度參考了趙世振提出“慢切換”控制方法的論文。

自己的論文被借鑒和參考,這是對他多年研究的認可,更是一劑強心劑。

相較于個人的喜悅心情,趙世振感觸更深的是,這會對研究光電混合資料中心這個領域起到促進作用,相信一定會有更多優秀的學生願意加入這項研究。

在這之後,趙世振和他的團隊并沒有停滞不前。光電混合網絡若想得到工業界更廣泛的認可,必須能夠支援資料中心不同業務的不同需求。例如分布式存儲、高性能計算、AI人工智能等場景,需要無損網絡的支援。

而現有光電混合資料中心一旦開啟鍊路層的流量控制避免丢包,就可能觸發網絡死鎖,造成網絡癱瘓。

針對這個問題,他們基于“圖映射”理論設計出全新的路由方案,使光電混合資料中心能夠完全避免死鎖。

正是靠着堅持不懈的研究,克服困難的勇氣和一點點不斷累積起來的進步,這個原本前景不明朗的領域未來的發展也變得逐漸清晰起來。

趙世振坦言:“在我之前,很多人認為這個方向隻适合在實驗室裡發論文,因為傳統設計 對光交換硬體切換速度和網絡控制器的收 斂速度要求極高,實際的軟硬體很難做到。”但他另辟蹊徑,探索出一套更易于落地的方案。

除了科學研究,趙世振還是一位特别年輕的老師。

與很多老師不同的是,趙世振比較看重學生對整個計算機領域,以及領域中各個方向之間的關系的認識。

“我的研究工作的一個特點是:着重針對業界碰到的難題提供解決方案。這和‘從論文中找問題’‘拿着錘子找釘子’的研究模式很不一樣。我在培養學生的時候也是貫徹這個思路。”

是以,比起讓學生一上來就去盲目地讀論文,他更願意帶領學生感受業界的真實情況,找出其中尚待解決的問題,深入其中,最終提供方法解決問題。

趙世振相信這樣的教學方式一定能幫助和鼓勵更多人,并在不久的将來吸引更多優秀學生加入研究,推動整個領域更進一步。

眼下,趙世振及其團隊的研究還在繼續,未來還會出現許多難題需要逐一攻克,但他堅信隻要保持初心和熱愛,在研究中一步一個腳印,定能驅散迷霧,撥雲見日。

責編 | 蘇寒山

繼續閱讀