大模型乘風破浪 AI打通應用落地管道

編者按

AI浪潮已經到了跨越奇點、對齊未來的全新發展階段。

6月6日，本年度21世紀卓越董事會人工智能閉門會議彙聚20餘位業内專家、學者以及多位上市公司高管共話AI領域核心話題，對AI領域創新、技術難題與發展路徑展開深入探讨。

近年來，随着以GPT為代表的大模型技術不斷演進，“通用性”成為人工智能發展的最新注腳。在業内看來，通用人工智能技術能夠賦予産業發展新動力。

近日，在由21世紀經濟報道、北京人工智能産業聯盟元宇宙專業委員會、中國文化産業協會文化元宇宙專業委員會主辦的“21世紀卓越董事會人工智能閉門會”上，多位專家、學者、企業高管共話“AI領域上市公司創新湧現、技術難題與發展路徑”。

對于通用人工智能技術發展，工信部賽迪研究院電子資訊研究所副所長陸峰表示，“人工智能已經從專用人工智能發展到通用人工智能的臨界點，要高度重視未來人工智能化時代，人工智能應用将無處不在。”

與此同時，大陸一大批科技企業正相繼布局大模型技術與産業化落地，應用行業也正從辦公、生活、娛樂等方向，向醫療、工業、教育等領域加速拓展。會上，多位參會嘉賓共同探讨了應用落地探索與挑戰的話題。

圖檔來源：新華社

通用人工智能勢起

中國科學技術資訊研究所、科技部新一代人工智能發展研究中心聯合相關研究機構編寫的《中國人工智能大模型地圖研究報告》顯示，中國自2020年起進入大模型快速發展期，現已在大模型方面建立起涵蓋理論方法和軟硬體技術的體系化研發能力，形成緊跟世界前沿的大模型技術群。

從政策面來看，4月28日的中央政治局會議明确指出，要重視通用人工智能發展，營造創新生态。

5月5日的二十屆中央财經委一次會議再次強調，要把握人工智能等新科技革命浪潮。

為推動人工智能創新發展，北京、上海、深圳等多地紛紛出台相關支援舉措，集聚人工智能創新資源，搶抓大模型機遇，開展大模型創新算法及關鍵技術研究，打造人工智能創新高地。

據中國信通院測算，2022年大陸人工智能核心産業規模達5080億元，同比增長18%。與垂直人工智能相比，通用人工智能已經不局限于處理單一任務，實作了跨領域、跨學科、跨任務和跨模态的應用。

在陸峰看來，人工智能經過幾次高潮和低潮，目前正經曆第三次高潮非常關鍵的時刻。随着人工智能技術、算力、算法不斷突破，為從數字化、網絡化到智能化的跨越發展奠定了一些基礎性的條件。

是以，他認為，要充分關注應用需求的緊迫性。“未來很多領域由于人口結構的變化，由于很多新生代對于傳統勞動環境的不适應，是以必須要以機器來換人。”陸峰說。

根據IDC預測，2023年企業在人工智能技術上的投入将達到1540億美元，增長27%，這或許意味着今後人工智能将釋放巨大的市場需求。

中國科學院科技戰略咨詢研究院研究員周城雄認為，人工智能的發展有兩個邏輯在起作用，一個是技術邏輯，還有一個是政策邏輯，可以說目前政策邏輯在其中起着很大的作用。

他指出，中國人工智能政策方面，包括《中國制造2025》、《新一代人工智能發展規劃》等相繼出台。近期網信辦釋出《生成式人工智能服務管理辦法（征求意見稿）》，對生成式人工智能，包括社會公德、個人資訊、資料方面将進行規範。

周城雄認為，社會主體的價值在于加速人類體力、腦力和創新能力的解放，現在人工智能是加速人類創新能力的解放。他進一步指出，近期調研中，已經明顯感受到人工智能逐漸發揮更多的作用。

“現在高校實驗室有一些實驗都是機器人在完成，有的人工智能技術還可以閱讀上萬篇文獻後寫出一個文獻摘要，還有的通過關鍵詞輸入就可以寫學術論文。”周城雄表示。

技術端、産業化對齊未來

“不管元宇宙也好，還是AIGC也好，都是在提升效率。在整個AIGC的應用過程中，做垂類的應用是有很多空間的。實際上GPT出現以後，以前的一些人工智能模型也還是可以優化的。”北京人工智能産業聯盟元宇宙專委會主任、大資料分析與應用技術國家工程實驗室網信智能中心副主任顔陽指出。

顔陽認為，人工智能除了要有技術上的突破，還要有商業模式的突破。在突破技術瓶頸的過程中間一定要找準自己的商業模式，很多不是大流量平台的機構肯定做不到OPENAI平台那種對C端市場的梅特卡夫效應，但是要非常關注整個過程在B端市場的雙邊市場效應。

他表示，從技術角度看GPT，它現在最根本依賴的Transformer模型，其底層較多涉及向量矩陣的點積計算，是以通過硬體在處理這些運算時還有很多的優化空間。是以，綜合考慮存儲、傳輸和計算的整體影響，通用GPU大機率開始向專門支援Transformer的AI加速的方向轉移。

另外，顔陽認為，根據Transformer的基本原理來看，很多模型可以做優化的，例如不一定需要同時加入編碼器和解碼器等等，而需要根據場景來做比對。未來在整個生态過程當中，有可能是群雄逐鹿。

但他同時指出，整個GPT模型也并非一股腦往大做就是最好，因為根據有關機構測試表明，大模型大資料的模型在訓練時的損失也會很大，但如果從U形的兩頭突破（也即是小資料大模型或是大資料小模型），可能是中國“沙丁魚”出圈的契機。

在他看來，金融行業或許會有很大的應用空間。現在金融行業應用較少，部分原因是用一些大模型對資料精準的計算不太友好，但現在開源模型稍微修改以後對結構化的資料反而很有效。前幾年用邏輯回歸都能做到這種程度，現在有大模型加持的情況下，把使用門檻大幅度降低，海外已經有對小盤股股指做預測的實驗室案例。

另外在科學研究領域，他認為，大模型在結構生物學方面也還是有很大空間，雖然說Alphafold2此前在蛋白質結構預測方面取得了重大成就，但還有很多涉及算力與資料不足的有待改善的方面，為大陸在該領域的垂類應用帶來了非常大的想象空間。在IT領域裡DBA（資料庫管理者）的工作也是相對複雜的，現在通過Text to SQL，也可以提升DBA工作的效率。

“我們也在做國産化，第一步先把開源做起來，例如我們把相關的代碼轉起來以後，就可以形成自己的開源生态，例如現在虛拟空間的NPC都可以用AIGC形成，支援商業合作夥伴直接使用，如果他們用起來非常友善，也非常低廉，此後便可以開始進行循環疊代。”顔陽稱。

“以前說是奇點已來，現在我們期望：跨越奇點，對齊未來。”顔陽表示。

應用落地探索與挑戰

人工智能在大模型泛化的過程中，企業更多是立足于自身背景和産業優勢進行布局。會上，多位科技企業負責人提到了在研發以及應用落地的過程中面臨的挑戰。

昆侖萬維（300418.SZ）CEO方漢介紹道，在商業化方面，公司采取To B跟To C并重的戰略。據悉，2022年12月，昆侖萬維正式釋出“昆侖天工”，其AI生成能力已覆寫圖像、音樂、文本、程式設計等内容模态。今年4月17日，昆侖萬維正式釋出天工大語言模型。

B端方面，方漢總結道，如何把行業資料生成大模型可用的資料是最難的事情。他表示，國内非常多的企業都缺比較好的資料，國内現在要To B的應用，要幫助所有行業把現有的知識推導過程給補上，不能光有題目跟答案，而要把推導過程給列出來，這樣才能讓各個行業去利用。

談及海外市場拓展，他認為中國企業最适合的是C端市場，在海外的C端市場可以做端到端的内容生成工具。“這個聽起來比較簡單，但實際上目前所有的AIGC工具都不是端到端的内容生産工具，而是素材生産工具。”方漢稱。

另外，在方漢看來，端到端内容生成工具仍有一個技術難點沒有解決，一旦解決了一緻性的内容生成之後，整個影視行業、短視訊行業都會被颠覆，而且一緻性視訊生成有望在1-3年之内取得突破。最遲3年以後，人類将可以用AI來生成一緻性非常強的長視訊。

拓爾思（300229.SZ）拓天大模型預計在6月底前推出。會上，拓爾思副總裁林松濤表示，大模型技術場景落地中的挑戰，主要是品質、可控、時效和成本。

品質方面，他認為，個人服務用ChatGPT，提示詞不準可以換一個，如果圖檔生成不好也可以再換一個，可以說個人對AIGC的容忍度是很高的。但是企業不一樣，給政府寫顧問報告，資料來源必須是準确的。

可控層面，一是内容安全，資料是有價值觀的，模型沒有價值觀。二是私域資料安全，中國大模型要資料化落地，如何在保證使用者私有資料安全的同時将大資料較好地運用也是一個問題。

時效方面，在大資料訓練上，災難性的遺忘一直都是訓練的問題，是以需要大模型解決這個問題。另外，怎樣輸入即時資料，類似Chat GPT，資料最新隻到2021年9月，是以在To B服務的時候用不好。

成本方面，千億模型私有化落地的時候需要訓練好，在企業端落地還需要讓企業用得起。拓爾思做To B服務，垂直場景落地成為“百模大戰”的核心要點。

此外，中科聞歌于6月3日釋出雅意大模型，推出了媒體、金融、宣傳等領域的大模型應用。會上，中科聞歌副總裁、首席産品官汪小東亦表示，目前做大模型有生态、場景、測評機制、算法等四方面的挑戰。

“生态方面，現在國内開源生态還比較弱。場景方面，現在落地場景還比較少，存在場景的欠缺。使用者側如何貢獻資料也至關重要。國内成體系的較科學的模型測評機制尚欠缺。各家模型水準需科學公開公正評定，這樣才能規範市場，促進良性發展。同時，針對大模型幻覺等問題，算法上的持續創新和突破也是大的瓶頸。”汪小東稱。

更多内容請下載下傳21财經APP