打開文心大模型，一看全是生産力

機器之心報道

作者：澤南、小舟

百度文心按下了 Turbo 鍵。

最近一段時間，人們在熱衷于給大模型「考試」。

不論是适用于機器的 Benchmark 跑分，還是人類的聯考題，在一次次橫向測評中，技術的發展進度被不斷量化。對比中取得了好成績的 AI，一時會受到人們的熱捧。

然而在現實世界這個「考場」上，很多時候不存在所謂的标準答案，AI 會遭遇各種訓練中未曾遇見的情況。更進一步，大模型的應用也要面臨是否有用的靈魂拷問。對于技術快速發展的大模型來說，實際落地的效果，才是評判能力最重要的一環。

在雲南瀾滄縣，人們正在使用基于文心智能體平台建立的「農民院士智能體」，根據朱有勇院士的指導，開展旱地農業。

全新的智能代碼助手文心快碼，百度 80% 工程師都在深度使用，其中代碼采納率已達到 46%。

就連古老的甲骨文也已經被 AI 煥活，變得能與我們對話。點選甲骨文，還可以看到大模型生成的釋義。

這一切，都是昨天百度 WAVE SUMMIT 深度學習開發者大會上的最新技術展示。百度，正在「實用性」這條道路上日夜狂奔。

文心大模型，進入 Turbo 時代

兩個月前，文心大模型 4.0 工具版剛剛釋出，今天又釋出了文心大模型 4.0 Turbo。

昨天，文心大模型上線了最新的 4.0 Turbo。基于今年 4 月上線的文心大模型 4.0，再次實作了提升。新版本的速度更快、效果更好，目前文心一言的網頁版、APP 陸續上線，供開發者使用的 API 也已上線。

感受一下 4.0 Turbo 的速度，直接和文心大模型 4.0 進行對比：

輸出的内容有所不同，品質都不錯，不過速度上的差異非常明顯，Turbo 太快了。

我們第一時間測試了網頁上的 Turbo 版。看起來大模型能夠感覺到近期發生的新聞，生成答案的速度比我們看文字的速度要快很多，而且整理出來的答案邏輯清晰，最後也附帶了引用連結。

有新一代深度學習平台飛槳給 4.0 Turbo 作技術底座，百度提升了大模型訓練資料的體量，優化了資料的分布和品質，進而不斷疊代訓練算法。在此基礎上，有監督精調、人類回報的強化學習、提示詞工程等調優技術持續進步；文心大模型獨有的知識增強、檢索增強和對話增強技術也有了改進。

智能體能力在文心 4.0 Turbo 上也有了增強。在強大的基礎模型之上，進一步進行思考增強訓練，提升了智能體了解、規劃、反思和進化等能力。現在大模型的 Agent 能夠做到可靠執行、自我進化，并一定程度上可以将思考過程白盒化。通過智能體，AI 能夠像人一樣思考和行動，調用工具自主完成複雜任務，還能在環境中持續學習，自主進化。

目前，文心大模型系列已經擁有文心輕量級、文心 3.5、文心 4.0、文心 4.0 Turbo 等多種不同性能體量的模型，以及大模型智能體技術，面向開發者，覆寫了大多數場景。

其中，文心輕量級模型适合解決确定場景的問題，具備出色的性能和成本表現；文心 3.5 具有良好的通用性，适用于日常資訊處理和文本生成任務；文心 4.0 模型規模更大、能力更強，具備更強的了解能力、邏輯推理能力與更豐富的知識，提供專業且深入的幫助；文心 4.0 工具版則基于智能體技術，善于綜合運用多種工具和資料，按要求完成非常複雜的任務。

而新釋出的文心大模型 4.0 Turbo 既可以實作很好的效果，速度也更快。

大模型能力，不再浮于代碼之上

應用落地是大模型的發展趨勢，通過不斷實踐，大模型可以找到技術精進的新方向。

在 WAVE SUMMIT 上，我們看到大模型能力不再浮于代碼之上，而是能以「農民院士智能體」、「體育大模型」這樣接地氣的方式，成為了很多行業上有意義的工具，在實際應用中創造出了前所未有的價值。

在雲南省瀾滄拉祜族自治縣，由于土地貧瘠、自然災害頻發，水稻種植曾經是一件非常困難的事情。2015 年，中國工程院朱有勇院士及團隊走進大山開展科技扶貧。朱院士團隊在當地教學旱地優質稻等作物的特有種植知識。在朱院士的努力下，當地農民學到了相關種植技術，作物種植水準有了質的提升。

然而，作物種植過程可能會遇到各種各樣具體的農業生産問題，如果能夠随時随地詢問朱院士種植問題，當地農民在旱地優質稻等作物的種植上會做得更好。

在人工智能時代，這個問題就由 AI 解決了。

在 WAVE SUMMIT 上，百度展示了中國工程院朱有勇院士及團隊與百度共同打造的首個農業智能體 ——「農民院士智能體」。它基于文心智能體平台建立，學習了朱有勇院士的研究成果以及相關的農業知識。農民能夠随時随地向智能體提問農業生産問題，獲得專業、詳盡的解答。

這個智能體在網頁端、App，以及小度智能裝置上都可以使用。我們發現，在文心一言 APP 中，打開「農民院士智能體」功能，就可以詢問關于作物種植的具體問題，并得到專業回答：

「朱院士就在我的手機裡，同他本人一模一樣」，「我們問什麼，他就答什麼，就像他坐在我旁邊一樣」，瀾滄拉祜族自治縣竹塘鄉雲山村村民這樣評價「農民院士智能體」。

「農民院士智能體」已然成為當地村民有力的知識助手。這讓我們看到了大模型在專業領域的實際應用價值，賦能各行各業的願景在此刻得到了具象化。可以預見的是，掌握專業知識的智能體将成為合格的知識助手。

AI 也可以幫運動員獲得更好的成績。百度與上海體育大學探索體育科技，基于先進 AI 大模型，融合大量體育專業知識，建構了「上體體育大模型」，實作了很多運動項目上輔助訓練、技戰術分析、實時回報分析，資料采集、姿态分析，再到媒體傳播等一系列能力。

這樣的 AI 應用目前已經覆寫了遊泳、田徑、體操、蹦床、攀岩等多支國家隊，支援了重大賽事準備時的訓練。參加巴黎奧運會的部分運動員就獲得了 AI 的幫助。此外，體育大模型也已經在全民健身領域發揮了作用。

在很多公司還在卷基準測試、跑分排名的時候，百度給出的是更具說服力的數字：文心一言累計使用者規模已達 3 億，日調用次數也達到了 5 億，使用者日均提問量在過去半年時間裡增長了 78%，提問平均長度提升了 89%。

在文心一言上，人們使用大模型産品的興趣正在增加：在一些場景上的需求得到滿足之後，人們很快尋找到了更多場景；從剛開始簡單的一問一答查詢問題，已變成了設定複雜的規則，提供示例，再要求大模型完成更複雜的任務。

在開發者一側，文心大模型的星河共創計劃，已經建構了 55 萬個 AI 原生應用，超過 1000 個大模型工具，集合了超過 1000B 高品質的稀疏資料。

當然，它釋放的價值，還可以直接幫助建構工程師，展現在代碼程式設計上。

開發，正加快提速

百度的智能代碼助手 Comate 現在有了一個中文名「文心快碼」。作為一個智能 IDE 插件，它支援 19 款主流 IDE，100 多種程式設計語言。

百度副總裁陳洋表示，在大模型的支援下，文心快碼可以續寫已有代碼，利用自然語言指令生成代碼，也可以根據注釋寫代碼，在代碼的基礎上生成注釋，或利用私域知識進行模型增強和精調。

昨天釋出的文心快碼 2.5 版本實作了對開發過程的全流程覆寫，實作了知識增強，在企業級安全方面也有了巨大提升。

名字叫快碼，「快」主要展現在三個方面：開發速度快、業務疊代快、企業落地快。

為什麼開發速度快了這麼多？這背後是 AI 對研發知識的深刻了解和應用。數百位技術專家的經驗，融合了十億級的研發知識，最終形成了一個開發超級助手，其生成代碼的生成準确率高達 80%。

據介紹，百度内部使用文心快碼之後，工程師在機關時間内送出代碼的數量提升了 35%。

更進一步，整個開發流程也被加速了。它可以在提需求的時候幫你想，研發的時候幫你寫，測試和釋出時幫你改，甚至根據企業内部的規範提醒産品經理，并不斷檢測代碼中的安全漏洞。在百度内部，文心快碼落地後，業務疊代的速度端到端整體提升了 14%。

最後，這一套工具可以不斷推廣到更多企業中去。文心代碼可以提供整套最佳業務實踐和流程。百度的上萬工程師，80% 都在深度使用文心快碼，是國内使用智能代碼助手規模最大的團隊。而在外部，喜馬拉雅經過一個季度就實作了全面落地，代碼的采納率達到了 44%。

這樣的代碼采用率，可能比一些人類程式員還高。據介紹，文心快碼落地的客戶還有很多，包括三菱電梯、軟通動力、吉利汽車等等，超過上萬家企業，覆寫千行百業。

逐浪的飛槳

我們知道，文心大模型能夠持續快速進化，一直得益于百度從晶片到架構，支撐模型和應用的全棧布局。其中，飛槳深度學習平台的聯合優化起到了大作用。

在 WAVE SUMMIT 上，百度釋出了新一代 AI 架構 —— 飛槳架構 3.0，目前已經面向開發者開放。

在新版設計上，百度充分考慮了目前大模型發展的趨勢，以及異構多晶片的硬體體系。新版本的架構使用時對于大模型訓練推理擁有一體化能力，強調大模型訓練開發中的自動并行能力，實作了編譯器的自動優化，簡化了開發調優的過程，并完成了大模型的多硬體适配。

為了實作上述技術優勢，首先從訓推一體的需求出發，在底層設計了高擴充中間表示 PIR，建構了高效靈活的 Pass 機制，使開發成本降低了 58%，并讓飛槳模型庫 84% 的模型推理加速超 10%。

衆所周知，大模型混合并行的開發是非常複雜，涉及混合并行、通信、排程政策。為簡化這項工作，百度研發了自動并行能力，為代碼的開發做更好的封裝，做到全局的靜态優化，并使性能上限得到進一步的提升。借助飛槳的動靜統一自動并行能力，不同參數模型的訓練性能均可得到提升，提升幅度可達 20%。

對于 AI 架構來說，性能優化是重要屬性。結合編譯器的設計，飛槳可以大幅簡化優化過程。在前端做好相應的編譯器表示，在後端把前端的表示轉化為底層的表示，以對接硬體，實作自動優化代碼。通過編譯器來做算子的自動融合，執行速度會比算子調用提升 4 倍，比手動融合提升 14%。通過這一系列編譯性能的優化，在生成式模型的推理上，無論是語言模型還是擴散模型，推理性能都有非常顯著的提升，提升幅度可達 30%。

在大模型的設計過程中，訓推一體非常重要。像飛槳可以自動把動态圖轉化為靜态圖，訓練的壓縮推理得到了無縫銜接。通過調用高性能算子，RLHF 的訓練加速可以達到 2.1 倍。此外，量化過程可以複用分布式政策，使量化效率提升 3.8 倍。

通過 30 多個接口，飛槳可以全面支援大模型的訓練和推理。硬體廠商隻需要對基礎算子進行适配即可接入，大幅減少了工作量。此外，它還在軟硬體協同優化方面下功夫，更好地實作了協同的性能優化。

飛槳平台對于大模型具有重要意義，很多文心大模型的能力是與飛槳聯合優化才能實作的。這就好像船和槳的關系。

在基礎的計算優化方面，飛槳在模型的訓練上實作了塊狀稀疏掩碼注意力計算、存算最優平衡的精細化重計算，在分布式擴充中實作了靈活批次虛拟流水并行、多模型結構混合并行。此外，還進行了跟硬體的通信聯合優化。

在推理方面，通過高性能分段矩陣與多流加速計算讓 LoRA 獲得了集約化的部署，以得到更極緻的推理效率。同精度下，LoRA 的推理性能可以提升 33.3%。量化後性能可以提升 113.3%，且支援的 LoRA 個數達到 6 倍。

飛槳還實作了異構多芯的混合部署，可以進行動态排程，把不同請求配置設定到不同性能的晶片上，以最大化資源利用的效率。

一組數字：1465 萬開發者、37 萬家企事業機關、 95 萬個模型，這就是飛槳文心建構的生态一瞥。

從算力、架構、模型到實踐，這套國内首個大模型全鍊路生态支援體系，在這場全球大模型競賽中不斷發揮着作用。别人努力的終點，隻是百度的起點。

通用人工智能，曙光已現

2024 年即将過半，「百模大戰」也已進行了一年多，行業發展到哪了？接下來又會往哪卷？

在昨天的大會上，百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰從兩個視角解讀 AGI 發展：技術通用性、能力全面性。

首先是技術的通用性。人工智能技術經曆幾十年發展，到了大模型時代，一套架構和技術已經可以解決各種問題。除了算法，模型也變得更加通用和統一。不同任務、語言、場景還是各種模态，都可以用同樣的基礎模型搞定。

以自然語言處理為例，以前有分詞、句法分析、語義比對、機器翻譯、問答、對話等等很多子方向，現在一個大語言模型就可以解決絕大多數任務；語言方面，大模型既可以解決單語言的問題，也可以跨語言，不僅學習了人類的自然語言，也學習了人工定義的形式語言，架起了從思考到執行的橋梁；同時，大模型也可以實作多模态的統一模組化，廣泛賦能各行各業應用等。總體上，人工智能技術的通用性越來越強。

然後是能力的全面性。了解、生成、邏輯、記憶是人工智能的四項基礎能力，創作、解題、代碼、規劃、決策等人工智能的典型能力，基本上都是這四項基礎能力的綜合運用。這四項能力越強，越接近通用人工智能。

不過，想要用這通用的技術，去實作全面的能力，并不是所有人都能玩得轉的。

由于大模型對于人才、算力、資料的高要求，在高烈度的競争下，技術競賽的格局正在變得逐漸清晰。從創業公司到各家大廠，領跑梯隊已經領先出一個身位。

更進一步，真正建構出完善 AI 技術體系的玩家需要直面應用場景，打造出能夠推動生産力的實際應用。而相比發展技術，技術落地所面臨的挑戰或許更多更大。

兩周前，微軟 Copilot GPTs 即将停服的消息引發了業内關注：僅僅開放 3 個月，這一擁有衆多使用者的技術應用就因為「公司戰略調整」而宣布退休。究其原因，針對場景不明确，缺乏商業回報都是可能的因素。

最近又有媒體報道稱，OpenAI 通過出售 GPT-4 等大模型能力獲得的收入，已經超過了它背靠的微軟在同類業務中的收入。

不論大模型技術如何先進，每 token 的成本如何降低，即使出自頂尖的科技巨頭，無法擁抱場景生态的 AI 應用仍将被快速淘汰。即使是微軟這樣的公司，也面臨着挑戰。

而擁抱場景，或許正是國内科技公司所擅長的事。

看到如今文心一言的發展和落地，我們已經可以說，2019 年第一屆 Wave Summit 上喊出的「AI 進入工業化大生産階段」，已經一步步走向了現實。随着大模型進入産業爆發期，通用人工智能正在加速到來。

打開文心大模型，一看全是生産力

繼續閱讀

【Scientific Reports】張靜團隊開發首個乳腺癌患者認知障礙的預測模型

施工豎井開挖過程中圍岩壓力變化規律的模型試驗研究

大模型技術成關鍵，訊飛星火V4.0受企業青睐

大模型加速走出“對話框”深入産業端

“智”時代，家電業如何晉級②——垂域大模型篇

AI大模型熱潮後的深耕，以“知乎直答”為筆，繪就知識探索的星河

對話騰訊湯道生：AI不止于大模型

微軟開源GraphRAG：極大增強大模型問答、摘要、推理

共建AI生态，“什麼值得買”智能體獲“訊飛星火大模型”官方推薦

“AI大模型時代”下的全球産業鍊重構解讀報告（洞察未來十年）

訊飛星火V4.0釋出!越來越多的使用者開始享受大模型帶來的紅利

AI大模型測評報告：超8成傳媒行業受訪者對大模型表示擔心

對話小馬智行彭軍：不要迷信大模型，自動駕駛格局已變

暖哇科技推進AI大模型在保險業的深度應用，私域整體産能提升20%+

哪吒L車型首次OTA更新1.1.0推送：NETA GPT大模型上車

不止于“AI寫歌神器”！昆侖萬維：做中國人自己的大模型