天天看點

企業建構AI大模型應用的步驟流程與關鍵問題解析

作者:CIO之家

建構企業級AI大模型驅動的應用系統是一項跨越技術與業務邊界的綜合性任務,它不僅考驗着企業在業務領域知識的深度,也挑戰着企業基于AI大模型建構應用的技術高度。這一過程要求業務專家與AI大模型專家緊密協作,共同確定通過AI大模型的賦能,實作業務價值的倍增效應。

基于實踐經驗總結,可以系統化地将AI大模型應用的建構流程劃分為五個核心步驟:

1)需求場景的精确定義

2)大模型的科學選型

3)大模型性能效果的強化調優

4)大模型的部署與運作維護,以及

5)AI應用的無縫內建。

針對這一過程中的每一關鍵環節,本文将深入剖析企業所面臨的政策抉擇與潛在難題,旨在為那些意圖搭乘AI大模型發展浪潮、加速數智化轉型的企業提供一份具有可操作性的行動指南。

企業建構AI大模型應用的步驟流程與關鍵問題解析

一、明确需求場景:精确制導,確定目标清晰

明确需求場景是項目起點,也是項目成功的基石。AI大模型專家需與業務團隊緊密協作,細緻剖析業務痛點,識别AI可解決的關鍵問題,同時考慮法規遵從與資源限制,為項目定下清晰且實際的目标。

  • 模糊不清的需求目标可能導緻資源浪費和項目延期。企業應首先明确AI應用的場景,如是否需要處理文本生成、情感分析、圖檔了解和生成等特定任務,這直接影響到後續的模型選擇與技術路線設計。
  • 未事先充分評估引發潛在風險。例如,在國内,對外提供服務的大模型及大模型應用,均需要經過安全評測備案。這就要求選型時慎重考慮避免使用海外大模型,資料傳輸出境等風險,避免産生合規問題。

這一階段明确需求場景和目标後,對後續指導模型選擇、評估計算資源和預算、設計合理技術方案、識别安全合規要求、乃至管控部署和運維大模型應用路線都具有指導意義。也是企業自身需要重點思考的環節。

通常情況,建議需求目标從點開始再到面,先從單點AI大模型能力與現有應用的結合開始落地,逐漸再考慮更深入更多場景的結合,最後再到基于AI Agent智能體思路重塑業務應用。

二、大模型選型:平衡藝術,精準拿捏

大模型選型階段,AI大模型專家依據需求分析結果,在衆多預訓練模型中甄選,不僅考慮模型的性能與準确性,還要平衡計算效率、成本及安全性,選擇與企業基礎設施相容性最優的解決方案。

  • 性能與成本的權衡:這點要求企業細緻考察市面上現有的各類大模型。通過基準測試了解模型上限,結合實際預算和性能需求做出決策,同時考慮模型的長期維護成本。一般來說我們會有這麼一個大模型選擇三角形,從效果、性能、成本三方面平衡考慮。在選型路徑上,建議首先用“最聰明”的基礎大模型(比如千億參數規模的通義千問max版本、多模态則為qwen_VL_max版)來做任務的上限效果測試驗證,如果“最聰明”的大模型可以滿足效果要求,再去考慮成本和性能問題,比如下調選一個小一點參數規模的大模型再測試,直到平衡滿足企業綜合需求。
企業建構AI大模型應用的步驟流程與關鍵問題解析
  • 安全與合規的考量:在國内尤為重要,涉及到大模型生成内容的安全可靠、大模型及應用的備案、資料出境限制等,建議選擇符合要求的大模型。
  • AI工具鍊和生态系統支援,對于大模型的持續優化和功能拓展至關重要。強大的AI工具鍊和社群支援意味着更多的應用案例、工具和解決方案,有助于企業快速疊代更新。國外的社群比較出名是Huggingface,國内則為阿裡雲的Modelscope魔搭社群。

三、增強調優大模型:精雕細琢,效能提升

随後的增強調優步驟中,通過提示詞工程、RAG、微調等方案政策,對標明的大模型進行優化,旨在提升其在特定場景下的表現效果與可靠性,確定大模型的輸出貼合業務實際需要。

  • 提示詞工程是指通過各種輸入設計來引導模型行為給出回複。特點是輕量,易使用,模型強相關。提示詞工程雖輕便易行,但也需要了解大模型特性,才能設計出高品質提示詞,高效引導模型輸出預期内容。
  • RAG主要結合外部知識資料,讓大模型更可控的回答垂直/封閉領域問題。RAG依賴高品質外部資料,是以資料的準确性和時效性、資料檢索和增強過程中的優化技巧是關鍵,處理不好會影響大模型的輸出品質。
  • 微調調優則是通過小規模訓練來優化模型在特定任務上的表現。特點是适配特定任務、高準确,但複雜且高成本。同時微調調優過程具有一定的不确定性,處理不當會出現過拟合、甚至影響原有基模能力。

針對目前三種主流優化方案,這裡簡單補充做個說明。經常有人問上述三種方案核心差別是什麼,怎麼選?我們先回答是什麼的問題。如下圖所示,本質上大模型和程式一樣,都是根據外部輸入,然後執行後給出輸出結果。程式=資料結構+算法,簡單的對應過來,大模型=模型結構+參數權重。是以說,提示詞工程,本質就是通過巧妙設計輸入,使之更好适配大模型中的模型結構,進而獲得更好的輸出結果;微調調優,則是基于給定的資料集做訓練,來優化更新大模型在預訓練時已經固定好的參數權重,讓後續的輸入能在該行業領域的任務上得到更好的輸出結果。

企業建構AI大模型應用的步驟流程與關鍵問題解析

接着看“怎麼選”的問題。對大模型的增強調優,在實際使用過程中,并非大家所想的按提示詞工程->RAG->微調調優這種直線路徑推進的。而是需要結合提示詞工程、RAG和微調調優等特點,反複嘗試,螺旋推進落地。下圖為OpenAI專家給出的一個大模型調優建議路徑。

企業建構AI大模型應用的步驟流程與關鍵問題解析

微調調優後的模型務必要做好模型評測。模型評測不僅驗證了模型在特定任務上的優化效果,保證了輸出品質達到預期标準,還通過全面評估模型性能,揭示潛在的偏見或不足,為進一步的疊代優化提供了資料支援。具體如何評測就不再贅述,可網上參考相關文章了解。

在增強調優大模型這個環節裡,資料集是非常重要的,不管是訓練資料集還是評測資料集。這是因為高品質的資料(包括資料的多樣性、品質和規模等)深刻的影響着大模型能力和企業AI應用價值倍增量級。經常很多企業在問,我們欠缺資料或者沒有高品質資料時,如何提升大模型應用效果。碰到這種情況,除了建議企業可以向外嘗試多種資料合作方式,也可先直接用基模或現成行業領域專屬大模型,同時着手規劃建設自己的企業資料平台。

四、大模型部署與運作:靈活應變,確定穩定

一旦模型優化成熟,便進入部署與運作階段,這要求專家精心設計部署架構,無論是雲端托管、邊緣計算還是本地部署,均需確定系統的穩定運作、彈性伸縮及高效運維,同時建立監控機制以應對潛在故障。大模型部署方式應根據企業的業務場景目标決定。根據模型參數規格大小不同,可以部署到終端智能裝置、IDC機房以及雲上。雲平台一般也根據不同場景提供更多的大模型環境部署和運作服務。如下圖所示。

企業建構AI大模型應用的步驟流程與關鍵問題解析
  • 推薦大部分企業優先考慮直接調用MaaS API服務的方式(類似阿裡雲百煉模型服務平台)。
  • 企業有開源大模型私有化部署需求的,首先考慮基于阿裡雲人工智能平台PAI做整體開發部署提供模型服務。如企業有AI團隊及技術積累,考慮自建的話,可推薦基于阿裡雲GPU雲伺服器建構。從成本和運作維護投入等方面考慮,原則上不建議純線下IDC自建智算資源和大模型服務。

五、AI應用內建:深度融合,釋放潛能

最後一個環節是AI應用內建,即将完成增強調優後的大模型部署運作後,無縫內建融入企業現有的數智化生态系統中,無論是通過MaaS API接口、插件、流程編排、Agent還是建構全新的使用者界面,目标都是最大化大模型的能力和價值,提升使用者體驗,促進企業業務流程智能化更新,進而驅動企業創新與競争力的飛躍。

本文作者:少軍叨叨 來源:少軍的AI空間

CIO之家 www.ciozj.com 微信公衆号:imciow

繼續閱讀