天天看點

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

Serverless 話題涉及範圍極廣,幾乎包含了代碼管理、測試、釋出、運維和擴容等與應用生命周期關聯的所有環節。AWS Lambda 是 Serverless 領域的标志性産品,但如果将其應用于核心業務,可能會遇到以下難題:(僅代表作者個人觀點)首度揭秘: 

  • 要求使用者以 Function 為機關進行開發,全新的開發架構,雲廠商強綁定,社群主流技術棧遷移成本高;
  • Function 啟動速度要足夠快,毫秒級或者秒級,這個限制對适用場景有很強的限制;
  • Function 之間的調用通過 API Gateway,響應時間更長。

本文将介紹阿裡雲中間件團隊在探索 Serverless 過程中的思考以及正在做的事,目的是盡可能讓開發者少改代碼,甚至不改代碼,就能具備 AWS Lambda 的技術優勢。

Cloud Service Engine 雲服務引擎(以下簡稱CSE),是阿裡雲中間件團隊開發的面向通用 Serverless 計算的中間件産品,目的是具備 AWS Lambda 的各種優勢,同時可以解決使用者在使用 AWS Lambda 時遇到的難題。

什麼是 Serverless

AWS 對 Serverless 定義是:(摘自 AWS 官網)

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

AWS 無伺服器平台提供的功能:(摘自 AWS 官網)

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

AWS 的整套 Serverless 方案非常完善,但是沒有解決存量應用如何遷移到 Serverless 架構的問題。僅僅是針對新開發的應用,建議使用者使用 FaaS 方式開發,才有機會轉向 Serverless 架構。筆者認為,要将 Serverless 架構大規模推廣,必須要能有針對存量業務的解決方案。

Serverless 對雲計算的價值

雲計算,歸根結底是一種 IT 服務提供模式,不論是公共雲還是專有雲(以IT裝置的歸屬不同分類),其本質都是幫助 IT 的最終使用者随時随地,并且簡便快速地,擷取 IT 服務,目前,IaaS、PaaS都已經做到了按需付費,PaaS 甚至做到了按請求付費,如DB,CACHE,MQ等,但是 IaaS 的付費粒度仍然是時間次元,最快按照小時付費,以分鐘來傳遞。

是以,當下的雲計算場景,應用的開發維護方式相比傳統 IDC 時代的開發維護,差别還不是很大。但 AWS Lambda 提供了一種全新的開發維護方式,使用者隻需要寫好業務代碼,送出到雲上,所有和機器容量、可用性、機器為機關的運維工作可以全部交給了雲平台,這種模式極大的釋放了雲的彈性價值,真正做到了按需付費。

CSE 試圖提供一種更規模化的解決方案,像 AWS Lambda 一樣,能進一步釋放雲的彈性價值,并且可以平滑遷移存量應用。

存量線上業務實作 Serverless 架構的挑戰**

存量線上應用程式具有以下特點

  • 資源配置設定速度 = 分鐘級
  • 應用程式啟動速度 = 10分鐘+

基于以上客觀條件,通常做法是提前預定好機器數量來應對任意時刻的流量峰值,假設上述技術參數變為毫秒級,就有機會将應用程式架構演變成下圖所示方式。

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

上圖中,Service A 在調用 Service B 時,如果 B 的容量充足,則調用成功;如果 B 的容量不足,這時候如果線程池滿,則直接觸發限流閥值,A 會收到一個錯誤碼,然後直接調用資源總控系統,資源總控系統負責新配置設定一個 Service B 執行個體,這個配置設定的速度非常快,耗時幾十毫秒,同時把 B 的服務位址直接傳回給 A,A 會将之前未完成的請求發送到新建立的 Service B。

以上過程對于開發者完全透明,具備了以下價值:

  • 價值一:無需管理伺服器,即無需容量評估;容量評估這件事情對于應用負責人一直是一個極難解的問題,因為我們很難預測未來的峰值是什麼。
  • 價值二:持續擴充;之前的做法是每個應用程式獨占一定數量的資源,如果變成Serverless 模式,所有應用程式可以共享資源池,每個應用程式幾乎可以無限擴充。
  • 價值三:按照請求計費;因為每個執行個體的啟動時間甚至比 FaaS 的函數啟動時間還快,就可以像 FaaS 一樣來核算成本,成本隻與以下因素有關
    • 請求數量(QPS)
    • 每次請求CPU執行時間,例如100ms
    • 每個執行個體的記憶體規格

綜上所述:為了做到以上描述的分布式架構,關鍵技術點在于應用啟動速度,這裡的應用啟動速度是指應用可以正常處理流量為止。

如何将應用啟動速度提高到毫秒級?

應用在啟動過程中通常會初始化多個元件,如各種中間件、資料結構,以及網絡調用外部服務。在阿裡内部廣泛使用 SOA 和微服務的情況下,應用在啟動過程中會大量加載共享業務 SDK,存在啟動過程達到10分鐘量級的情況,個别應用可能會更長。是以,這個啟動過程必須提前完成,才有機會以“臨陣磨槍”的方式去建立新執行個體。

方案一:應用冷啟動資源壓縮方案

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索
首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索
首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索
首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索
首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

L1 彈性能力是指在一台實體機或者大規格的 ECS 上部署同一個應用的多個執行個體,通過作業系統和 JVM 的優化,一個占用 4G 記憶體的應用,即使部署10份,僅需占用2.2G RAM。

L1 總結來看是一種高密度部署方式,由于應用已經提前啟動,并且對容器進行當機,意味着這個應用執行個體 CPU 占用率為0,RAM 占用相當于之前的1/20,但是具備了毫秒級彈性的能力。L1的特點是啟動速度極快,但是需要消耗資源,且隻能垂直彈性。

L2 是通過将應用程式啟動後在 RAM 中的指令和資料結構 dump 到磁盤檔案,隻需要在機器之間拷貝檔案即可以達到橫向彈性的能力,這個時間消耗主要是資料的網絡傳輸時間+記憶體拷貝時間,大約在5秒左右就可以完成。L2 的成本開銷隻有網絡磁盤容量,開銷極低,可忽略不計。

L2 的每個 SNAOSHOT 對應一個可運作的執行個體,例如預計一個應用需要最大啟動100個執行個體,那麼需要提前生成100個 SNAOSHOT,每個 SNAOSHOT 對應一個運作執行個體,需要啟動時,從遠端磁盤加載這個 SNAPSHOT。

此方案通過 L1 和 L2 的組合來達到加速應用啟動的目的,在支援一定流量脈沖能力下,可以最大50ms内啟動任意應用,平均在10ms内完成。

方案二:應用熱複制啟動加速方案

L1 采用通過 fork 種子程序達到快速啟動的效果,作業系統團隊專門為此開發了 fork2 技術,與 Linux Native fork 的關鍵差別在于可以指定 PID 來 fork 一個程序。

pid_t fork2(pid_t pid);           

L2 的單個 SNAPSHOT 可以建立多個程序,一對多關系。

兩種自研方案的對比

  • 方案一:不存在 UUID 問題,但是每種語言的 VM 要單獨定制,成本效果相比方案二略差。
  • 方案二:會存在 UUID 問題,若開發者希望應用的每個執行個體啟動時,都指派一個 UUID 給一個靜态變量,但通過 fork 會導緻每個執行個體的這個靜态變量都相同,這與開發者預期不符。方案二的優勢是更易實作、和語言無關、成本效果更優,适合 FaaS、NBF 這類場景或者開發者自己定義的開發架構,能避免 UUID 的問題。

整體來看,方案一的适用場景更廣,但是實作成本更高,方案二較适合 FaaS、NBF 這類場景。

和 AWS Lambda 相比

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

Lambda 為了做到快速擴縮容,要求使用者的應用以 Function 為機關開發,Lambda Runtime 動态加載 Function 來快速增加執行個體。

CSE 則通過将一個應用的多個執行個體啟動後,共享相同的指令資料,抽取出不同的指令資料,每次啟動執行個體隻需要加載多執行個體的差異部分。是以可以透明相容社群主流技術棧,如Spring Boot,PHP/Java/Python/Node.JS 等。

CSE 的成本優勢

理論模型:

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

Serverless 方式應用占用的執行個體數随時在變化,是以可以多個應用錯峰使用同一台機器。

量化分析:

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索
首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索
首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索
首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

Serverless 的成本優勢是可以和 CPU Share &離線上混部等排程技術的成本優勢做疊加,能給最終使用者一個更優的總體成本。

CSE 的代碼樣例

HSF demo

package com.test.pandora.hsf;
import com.alibaba.boot.hsf.annotation.HSFProvider;
@HSFProvider(serviceInterface = HelloWorldService.class)
public class HelloWorldServiceImpl implements HelloWorldService {
    @Override
    public String sayHello(String name) {
        return "hello : " + name;
    }
}           

Spring Boot demo

package com.example.java.gettingstarted;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
@SpringBootApplication
@RestController
public class HelloworldApplication {
  @RequestMapping("/")
  public String home() {
    return "Hello World!";
  }
  @RequestMapping("/health")
  public String healthy() {
    // Message body required though ignored
    return "Still surviving.";
  }
  public static void main(String[] args) {
    SpringApplication.run(HelloworldApplication.class, args);
  }
}           

CSE 的生産實踐

首次揭秘:阿裡巴巴中間件在 Serverless 技術領域的探索

某電商業務 A:Serverless 化後,機器數量從11台降低到2台(2~10台之間波動),某促銷節,服務流量峰值從數千瞬間飙到十多萬,CSE 瞬間彈性擴容,從2台-->5台-->10台,流量峰值回落後又縮容到2台。

某電商業務 B:Serverless 化後,機器數量從4台到2台(2~10台之間波動)。

某電商業務 C:之前固定4台機器,Serverless 化完成後,機器數量變成1台(1~4台之間波動),預發可實作0 - 1台執行個體之間波動。

本文作者:

王小瑞,花名:誓嘉,阿裡巴巴資深技術專家,Apache RocketMQ 創始人&Chair,近期負責推動阿裡巴巴線上業務向 Serverless 架構的演進,以及消息中間件産品線的雲計算方向,是阿裡巴巴中間件創新項目實驗室&消息中間件團隊負責人。

中間件團隊社招:

中間件創新項目實驗室&消息中間件團隊正在招聘中間件分布式系統研發專家,杭州/北京/深圳,P7/P8/P9,履歷直達 shijia.wxr#taobao.com ,詳情請點

這裡