天天看點

【F3使用場景】F3經典使用場景

1. 人工智能深度學習客戶,推理應用

最近兩年,人工智能在全球掀起了巨大的應用熱潮,除了網際網路巨頭,如Google,Facebook,Alibaba之外,湧現出衆多的Start up公司,也都逐漸成為行業翹楚。

在人工智能技術方案選擇上,GPU無疑是現階段的首選,這其中的主要原因,一方面,GPU完善的生态,高并行度的計算力,很好地幫助客戶完成了方案的實作和部署上線;另外一方面,人工智能發展,仍處于早期階段,各個行業都在從算法層面嘗試尋找商業落地的可能性,是一個從“0”到“1”的過程。在可以預見的未來幾年,随着人工智能落地應用越來越多,大規模商業部署漸漸成為可能,進而對于更低功耗,更低成本,更低處理延時,更多定制化等的需求,将會逐漸凸顯。可是F3在人工智能大規模商業部署(推理應用)中,具備獨特的性能優勢和廣闊的潛在空間不可小視。

  • 低延遲

相比于F3(FPGA),GPU計算的處理優勢,在于其衆多專用的并行計算單元以及超高的顯存帶寬,讓多路大規模資料搬移快速并行計算成為典型的計算模式,但這一模式導緻了每路資料的處理延遲增加,對于一些低延遲需求的線上業務場景,如語音識别等。在Batch值較小的情況下,F3(FPGA)的處理延時,僅為GPU的1/10。

  • 超高的定點計算力

對于深度神經網絡的計算,一個發展趨勢就是降低資料表示的精度,降低網絡對于計算力的需求,以提高計算吞吐量。從雙精度浮點到單精度浮點,再到定點處理。而定點運算卻是FPGA的傳統優勢,相比于GPU,FPGA内部配備了衆多的定點處理單元,甚至整個FPGA晶片内部邏輯資源全部可以配置成定點處理單元,進而具備了超高的頂點運算能力。

目前申請測試的客戶中,有很大一部分就是沖着F3的這些優勢而來,期望在其業務上帶來創新和産品的成本效益提升。

2. 基因測序

基因測序是一種新型基因檢測技術,能夠從血液或唾液中分析測定基因全序列,預測罹患多種疾病的可能性,基因測序技術能鎖定個人病變基因,提前預防和治療,目前基因測序廣為人知的是針對唐氏綜合征篩查的無創産前基因檢測。伴随着基因測序技術的快速發展,基因資料的生成呈現指數級增長,而應用也越來越廣泛,對分析能力提出更高要求。

傳統的計算系統通過采用多個高端CPU搭建HPC系統實作了縮短時間的目的,但這樣也使得成本增加,行業應用規模以及基因企業發展規模受限。目前國内基因企業,面臨基因計算成本偏高,而業務需求旺盛,急需高成本效益的算力資源解決行業困境。

以人類全基因組(WGS)分析為例,單個WGS,使用一台16c/64GB的CPU執行個體,完成分析需要近100小時的時間,而F3在30分鐘以内即可完成。極大地縮減了計算時間和成本。

通過選用F3雲主機,基因企業在基因計算環節可以大幅提升産能;而普通大衆,也能享受成本降低帶來的普惠。

3. IC設計原型驗證

在傳統的數字IC設計流程中,使用FPGA搭建晶片原型驗證平台,測試功能是重要的一個環節,在這個過程中,需要大量的FPGA邏輯單元。而對于傳統數字晶片設計公司來講,購買或者自研複雜的FPGA驗證單闆/或平台,耗時耗力,且不是公司主要業務方案,加之FPGA平台更新換代速度超過晶片設計周期,對于更大邏輯量FGPA闆卡的追求,不斷研制最新fpga闆卡一直是大型數字晶片設計的痛點之一。

F3雲主機,選用單晶片邏輯單元達250萬個的VU9P,支援雙晶片600Gbps的互聯,以及多闆塊間的100Gbps的互聯,最大執行個體支援16個VU9P晶片,很好地滿足了數字晶片原型驗證階段,對于大邏輯量的需求。

而客戶選用F3雲主機,避免了維護複雜FPGA闆卡的大量人力物力的投入,縮減了驗證平台的維護成本。

4. 視訊處理(視訊編碼,視訊内容處理)

随着視訊采集及傳輸技術的發展,視訊素材的分辨率和幀率在不斷提升。分辨率從2K到4K到8K;幀率從30到60到120;新的标準及技術,比如HDR,也不斷出現。

素材品質的增長,圖像碼流量也随之增長。人們需要壓縮率更好的壓縮算法标準,才能夠适應新的圖像壓縮需求:

• 同樣的壓縮率得到更好的畫質

• 同樣的畫質得到更好的壓縮率

以H.265編碼為例,目前客戶選擇的主流技術平台為CPU或者GPU。

對于H.265/HEVC編碼處理,FPGA方案有着最完善的功能和preset配置,支援最多的有利于提高畫質和降低bitrate的功能,适合各個場景下H265/HEVC的編解碼配置。同時具有靈活部署,易于更新的特點,非常容易就可以在某一個平台上更新IP特性,甚至根據需求,随時更換成其他協定的編解碼功能。

FPGA的可擴充性也是GPU不可比拟的,能非常容易的在同一塊FPGA上pipeline部署編解碼相關的上下遊應用;同時,因為FPGA之間的高速互聯特性,也可以友善地在不同FPGA、不同FPGA闆卡間部署完整的相關應用方案。

成本方面,高畫質IP雖然通道數量基本與GPU持平,但是帶來的bitrate的大幅降低,可以顯著降低帶寬成本、存儲成本,綜合成本是降低的;

以下為一個典型的H.265編碼測試場景,在編碼速度對應x265的“very slow”配置結果,FPGA編碼器能夠達到1080p60(60幀/秒)的處理能力,遠大于x265的3幀/秒。

【F3使用場景】F3經典使用場景

5.資料庫加速

在資料規模爆炸式增長的背景下,資料處理的速度,無疑是使用者所關心的。

以大型網際網路公司為例,每天處理的資料量級都在 PB ,每天更新的網頁以億計,每 24 小時更新的日志超過PB。這樣的資料規模,對于目前的處理平台,是個巨大的挑戰,需要大型的叢集來完成。而在這樣的資料處理規模中,資料倉庫的性能,直接關系到了資料本身的處理能力。

F3(FPGA)雲主機,得益于FPGA細顆粒度的資料處理能力,高并發度的并行計算能力,能夠大幅提升資料庫産品的性能:

  • 以資料庫進行中的排序單元為例,在PostgreSQL的核心處理單元加速中,F3相比CPU能夠帶來10倍以上的性能提升。
    【F3使用場景】F3經典使用場景
  • 再以時序資料的處理為例,大資料領域中,時序資料使用超過一半。廣泛應用于物聯網(IoT)裝置監控系統 ,企業能源管理系統(EMS),生産安全監控系統,電力檢測系統等行業場景。F3單路資料吞吐性能是單核CPU的30倍以上!
    【F3使用場景】F3經典使用場景

産品邀測頁面,檢視詳情:

https://promotion.aliyun.com/ntms/act/fpgaf3.html?

繼續閱讀