天天看點

百度集團副總裁吳甜釋出文心大模型最新更新,AI應用步入新階段

11月30日,由深度學習技術與應用國家工程研究中心主辦、百度飛槳承辦的WAVE SUMMIT+2022深度學習開發者峰會如期舉行。百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜帶來了文心大模型的最新更新,包括新增11個大模型,大模型總量增至36個,建構起業界規模最大的産業大模型體系,并通過大模型工具與平台的更新和文心一格、文心百中等基于大模型技術的産品應用,進一步降低大模型産業化門檻,讓更多企業和開發者步入AI應用的新階段。

百度集團副總裁吳甜釋出文心大模型最新更新,AI應用步入新階段

百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜

文心大模型全景圖重新整理,建構産業大模型體系

近年來,大模型的出現,為人工智能進一步發展帶來新機遇。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在峰會上表示,深度學習平台加大模型,貫通AI全産業鍊,夯實産業智能化基座,将進一步加速智能化更新。

百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,産業級深度學習平台飛槳和産業級知識增強大模型文心,互相促進、共同發展,已然成為産業智能化的基礎性平台。文心大模型持續圍繞“産業級”、“知識增強”兩大特性,延續“降低應用門檻”的發展路線,進行創新突破。在此次峰會上,文心大模型全景圖再一次迎來全面更新。

百度集團副總裁吳甜釋出文心大模型最新更新,AI應用步入新階段

文心大模型全景圖

在模型層,文心大模型一次性釋出11個大模型,涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足産業應用需求;在工具與平台層,全面更新大模型開發套件、文心API和提供全流程開箱即用大模型能力的EasyDL和BML開發平台,全方位降低應用門檻;新增産品與社群層,包括AI藝術與輔助創作平台“文心一格”、産業級搜尋系統“文心百中”和旸谷社群,讓更多人零距離感受到最先進的AI大模型技術帶來的新體驗。

作為推進大模型在行業深度應用的關鍵舉措,本次峰會上,百度聯合深圳瓦斯、吉利、泰康保險、TCL、上海辭書出版社重磅新發5個行業大模型:深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、TCL-百度·文心和辭海-百度·文心。吳甜表示,文心行業大模型是百度與行業頭部企業、機構聯合探索出的行之有效的大模型産業落地方式,讓大模型在實際應用場景中“不但能用還便捷好用”。截至目前,文心已累計釋出11個行業大模型,涵蓋電力、瓦斯、金融、航天、傳媒、城市、影視、制造、社科等領域,加速推動行業的智能化轉型更新。

百度集團副總裁吳甜釋出文心大模型最新更新,AI應用步入新階段

文心行業大模型家族

除行業大模型外,此次還釋出了5個基礎大模型和1個任務大模型,包括:知識增強輕量級大模型ERNIE 3.0 Tiny、跨模态了解大模型ERNIE ViL 2.0、跨模态生成大模型ERNIE ViLG 2.0、文檔智能大模型 ERNIE-Layout、單序列蛋白質結構預測大模型HelixFold-Single和代碼大模型 ERNIE-Code。

其中,知識增強輕量級大模型ERNIE 3.0 Tiny是以ERNIE 3.0千億參數大模型為師,通過多任務知識蒸餾手段将千億多任務大模型的所學遷移至輕量級模型中,訓練了10億級、億級、千萬級不同體量大小的輕量級大模型。ERNIE 3.0 Tiny具備非常優秀的泛化能力,同時相對于超大參數模型,推理速度提升數十倍到百倍,能夠顯著降低超大參數模型落地的成本。ERNIE 3.0 Tiny和ERNIE ViLG大模型将上線“鵬城雲腦”,在雲腦上精調訓練、部署服務,進一步降低大模型開發和應用的門檻。

文心大模型工具平台全面更新,全流程支撐大模型開箱即用

為了讓開發者更加友善、快速地使用大模型的最新能力,文心大模型工具與平台進行了全面更新。吳甜介紹到,在工具方面,文心大模型開發套件全面更新,釋出行業大模型定制工具,同時提供更加完備的場景化模組化工具、更為豐富的模型精調工具,以及大模型可信學習工具,讓大模型開發訓練更加靈活高效;文心API服務支援多種模型尺寸的精調,體驗專區提供更多可體驗能力,同時基于大規模叢集算力分布式推理加速能力,可滿足大規模高性能産業級調用。

大模型的開發、訓練、推理部署的門檻是非常高的。為了更好地支援大模型應用落地,飛槳釋出了端到端大模型開發套件PaddleFleetX。針對大模型的訓練挑戰,PaddleFleetX基于架構自适應分布式訓練能力,根據模型和硬體平台的特點,自動感覺硬體特性,支援在異構硬體上進行自适應并行訓練。同時,充分發揮飛槳動轉靜能力優勢,進行訓練加速,實作端到端的極緻性能優化。訓練過程還支援彈性容錯訓練,大幅提升訓練過程的魯棒性。針對大模型推理部署的挑戰,PaddleFleetX提供了大小模型無縫關聯的能力,以滿足大模型推理對性能的極緻要求。同時,PaddleFleetX支援自适應分布式推理技術,真正做到分布式政策的訓推一體,大可支援超大模型的服務化部署,小可協同極緻小型化政策,支援端側輕量化部署。

飛槳企業版AI開發平台EasyDL和BML也圍繞大模型的技術應用進行了全新更新,釋出了提供全流程開箱即用的大模型平台能力,加速大模型的産業化落地。

百度集團副總裁吳甜釋出文心大模型最新更新,AI應用步入新階段

飛槳企業版全面更新

據百度AI平台部總監忻舟介紹,在EasyDL零門檻AI開發平台預置了各種通用任務場景大模型,可以讓AI應用開發者獲得更好的模型訓練效果。在BML全功能AI開發平台上,端到端的并行訓練優化方案大幅提升了大模型訓練性能;預置的基于大模型的場景模型生産線,讓開發者在主流的場景開箱即用,快速建構大模型場景應用;新增的自動化推理服務監控能力,及時感覺變化和問題,驅動回報和疊代,讓AI應用的高效疊代閉環。

AI作畫産品“文心一格”推出三大新功能,産業級搜尋系統“文心百中”首次亮相

為了進一步降低應用門檻,讓廣泛的使用者可以使用文心大模型,百度釋出和更新2個由大模型為核心驅動的應用産品。

首先是AI藝術與輔助創作平台“文心一格”。在文心一格上,使用者僅需輸入文字創想,即可完成别具一格的畫作,受到使用者廣泛好評。值得一提的是,文心一格深谙中國文化精髓,所創畫作盡現中國風骨。本次峰會上,吳甜釋出了文心一格的三大全新功能:支援以圖生圖、支援可控的增删改等圖檔二次編輯和一鍵生成視訊,進一步激發創造力,降低内容生産成本。

繼文心一格之後,以文心大模型為核心驅動的第二個産品——産業級搜尋系統“文心百中”在峰會上釋出,該産品由百度搜尋與文心大模型聯合研制,命名寓意搜尋結果精準,百發百中。

百度集團副總裁吳甜釋出文心大模型最新更新,AI應用步入新階段

産業級搜尋系統文心百中

文心百中具有三大特性:極簡、強大、高效。文心百中采用純神經搜尋架構加資料驅動搜尋效果優化政策設計而成,應用起來極其簡便,僅需三步即可線上完成搜尋引擎的建構;文心百中擁有強大的語義了解能力,相比傳統模型實作了質的提升,已在多個場景展現驚豔的搜尋效果;文心百中具備搜尋系統從0到1的高效建設能力,相比傳統搜尋系統可減少人力成本90%以上;同時,基于小樣本學習能力極強的文心大模型,文心百中僅需少量的資料,即可實作不同行業的搜尋效果優化,十分高效。

文心大模型與飛槳共享生态,圍繞“産業級”和“知識增強”兩大特色,持續建構适合産業應用的模型體系。未來,将有越來越多的企業和開發者通過大模型加深度學習平台的模式,步入AI應用的新階段,進一步加速産業智能化更新。

繼續閱讀