近日,由人工智能實驗室 OpenAI 釋出的對話式大型語言模型 ChatGPT一路“狂飙”,在全球學術界和産業界卷起了新一輪 AI 龍卷風,成為了史上增速最快的消費級應用程式。
短短兩個月,這個 AI 界乃至科技圈的“新晉頂流”月活便超過 1 個億。社交媒體推特首席執行官埃隆·馬斯克在使用 ChatGPT 後直呼其“好得吓人”,甚至斷言“人工智能越發強大,離對人類産生威脅不遠了”。作為參考,為了達到 1 個億活躍使用者的“小目标”,Twitter 用了 5 年,Facebook 用了 4.5 年,Google 用了将近 1 年,就連蘋果使用者裝機必備的 App Store 都用了 2 年。
CSDN 創始人&董事長、極客幫創投合夥人蔣濤在《開談》欄目中談到,ChatGPT 的出現标志着 AI 進入了當年的 “iPhone” 時刻。據 2 月 13 日,北京市釋出的《2022 年北京人工智能産業發展白皮書》中提出,支援頭部企業打造對标 ChatGPT 的大模型,着力建構開源架構和通用大模型的應用生态。
與此同時,百度、阿裡巴巴、科大訊飛、360、京東等國内科技巨頭也紛紛官宣ChatGPT相關布局,旨在打造“中國版ChatGPT”。可以預見,這場以自然語言處理為核心的認知智能技術所帶來的革命,将會深刻地改變當今世界的生産和生活方式,甚至重構産業格局,是人工智能領域推動工業乃至社會變革的重大戰略機遇。
值得關注的是,在國内科技大廠中,長期深耕在AI技術領域的科大訊飛在智能語音、機器學習領域有深厚的技術儲備,其技術實力和應用都有不俗的成績,是以不少業内人士十分關注科大訊飛在 ChatGPT 賽道中的布局。
對此,科大訊飛在投資者互動平台表示,ChatGPT 主要涉及到自然語言處理相關技術,屬于認知智能領域的應用之一。科大訊飛在該方向技術和應用具備長期深厚的積累,在 2022 年 12 月已經進一步啟動生成式預訓練大模型任務攻關,類 ChatGPT 技術将在今年 5 月率先落地到科大訊飛 AI 學習機産品中。
ChatGPT成未來AI發展的兵家必争之地
ChatGPT 的本質上是一個由浮點數參數表示的深度神經網絡大模型(目前版本含約 1750 億個參數),屬于深度學習的架構。
科大訊飛副總裁、研究院執行院長劉聰
科大訊飛副總裁、研究院執行院長劉聰表示,ChatGPT 将為以自然語言處理為核心的認知智能技術發展提供新的“曆史機遇期”。
因為它不僅是停留在單一場景的人機對話,而是同時具備多種能力的通用“對話式 AI 系統”。ChatGPT 的意圖了解能力,在目前機器了解人類語言及生成人的自然語言水準中一騎絕塵。而 ChatGPT 的“類人化”,得益于其認知智能水準的進一步提升。
在人工智能技術中有三個層次,分别是計算智能、感覺智能和認知智能。其中最具有挑戰的就是認知智能。具體來說,認知智能指的是:認知智能旨在賦予機器了解和模拟人類行為的能力,使機器“能了解、會思考、有情感”。而讓機器掌握人類獨有的語言和知識能力的人工智能技術,包含了機器翻譯、人機對話、知識推理、機器閱讀了解、常識推理等具體任務,屬于人工智能發展的進階階段。
ChatGPT 的出現,代表着人工智能在認知智能領域前進了一大步。盡管中國在認知智能領域技術相關論文發表數量僅次于美國,但在品質上與美國還有一定的差距。令人欣慰的是,大陸認知智能已在教育、醫療、金融、政務等多個領域落地。與國外相比,國内在産業應用模式探索上走在了世界前列,具備良好的技術基礎、場景基礎和資料基礎。
以科大訊飛為例,基于強大的 AI 技術能力,早期便主導承建了認知智能全國重點實驗室,并取得了一系列領先的技術研究成果,在産業實作了大規模應用;2022 年在智慧教育領域累計獲得常識閱讀了解挑戰賽 OpenBookQA、QASC、ReClor 等 13 項認知智能國際競賽冠軍;針對智慧醫療領域釋出的系統可診斷 1200 多種常見病,累計提供 5.5 億次 AI 輔診建議;另外在人機互動領域、多語種技術研究方面均有着不俗的成績。
另一方面,科大訊飛面向認知智能領域陸續開源了 6 大類、超過 40 個通用領域的系列中文預訓練語言模型,在 GitHub 獲 13346 顆星,位列中文預訓練模型星标數第一。從各種資料中可以看出,科大訊飛在認知智能應用、預訓練模型的應用方面已經相當成熟,加上在AI特定領域和NLP領域多年的累積,科大訊飛可謂是擁有着 AI 領域縱深的先發優勢。
從技術儲備與技術實力上來看,CSDN 認為科大訊飛想要做出 ChatGPT 類的産品并非沒有可能。但做出中國版 ChatGPT,所需要的還遠不止這些。
算法+資料+算力,ChatGPT 三大基本盤
據劉聰分析,ChatGPT 之是以引發全球學術界和産業界的熱議和關注的關鍵原因,在于其通過至少以下五個次元能力的顯著提升:
- 海量高價值資訊的全量線上記憶能力;
- 自然語言輸入的任意任務和多輪對話了解能力;
- 複雜邏輯的思維鍊推理能力;
- 多角色多風格的長文本生成表達能力;
- 即時新知識學習應用與進化能力。此外,因為引入了代碼作為訓練語料,ChatGPT 還額外産生了自動寫代碼和了解代碼的能力。
總地來說,想要從 0 到 1 去打造一個中國版 ChatGPT,核心要素在于資料、算法和算力。
1、海量專業資料與場景,為大模型創新夯實基礎
基于人工智能技術,在 ChatGPT 給出的回答中,其準确性取決于使用的算法和訓練資料。通俗來說,可以将 ChatGPT 了解為通過大規模預先訓練,處理巨量語言材料,進而獲得接近人與人直接對話能力的一種算法模型。根據使用者的測試,在相對深度和專業的領域,受限于訓練資料的專業度,ChatGPT 在一些回答上容易給出“看似有理有據”的錯誤回答,這種情況在細節内容上尤為突出。
對于預訓練模型來說,資料的品質和數量直接影響模型的品質,是以,如何進一步引入顯性知識、常識類知識來提升目前輸出答案的可靠性和穩定性,尤其是在一些細節的内容上。
而AI起家的科大訊飛,在嚴格遵守适用法律法規前提下,憑借在訊飛輸入法、訊飛開放平台、消費辦公類産品中積累的大量資料,以及多年來在醫療、教育等專業領域累積了規模化的高壁壘、高門檻的專業資料,在資料數量和品質方面築起了自身的護城河,實力相當“能打”。
根據統計,目前科大訊飛在多年認知智能系統研發推廣中,已經積累了超過 50TB 的行業語料和每天超 10 億人次使用者互動的活躍應用。海量行業文本語料和使用者回報資料,足以實作達到人類專家水準的行業認知大模型的訓練需求。
2、算法與算力,是入局門檻之一
ChatGPT 效果體驗上獲得較大提升的原因之一是算法環節的突破,是以,打造一個類 ChatGPT 大模型,除了資料以外,還需要在算法和算力兩個方面努力。
據劉聰介紹,ChatGPT 以目前業界主流的 Transformer 模型為主結構,單次模型訓練耗時 1 個月,訓練成本達 1200 萬美元,超大模型的訓練需要大規模計算叢集以及對應的模型并行算法架構的支撐,是以他判斷 1000 張主流卡容量的獨立計算叢集是完成該類任務的門檻之一。
科大訊飛在 Transformer 深度神經網絡算法方面有着相當豐富的經驗,已廣泛應用于科大訊飛的語音識别、圖文識别、機器翻譯等任務中,并達到了國際領先水準。另一方面,還創新提出了知識與大模型融合統一的了解架構 X-Reasoner,有望彌補大模型的模糊記憶技術短闆。
超大模型由于參數規模大、資料體量大,是以需要更大的算力支援。科大訊飛的優勢在于,自身總部自建有業界一流的資料中心,為大模型訓練平台建設奠定了很好的硬體基石。此外,在工程技術方面實作了百億參數大模型推理效率的近千倍加速,為未來更大更多認知智能大模型技術經濟實惠規模化應用提供了可能。
劉聰認為,打造中國版 ChatGPT 更重要的一點在于,應該需要選擇一個社會剛需應用或有大量活躍使用者的應用作為切入點,這些應用可以結合使用者互動體驗資料,回報給模型後進一步提升模型的能力,在資料和模型之間形成正向回報循環的“漣漪效應”,使得疊代更新後的模型越來越強。是以,不局限于技術本身,打破實驗室與使用場景的壁壘,是達成有效“漣漪效應”的重點。
3、打破技術壁壘,以場景需求倒逼技術打磨
針對上述問題,科大訊飛早在 20 多年前便躬身入局。自 2005 年科大訊飛 AI 研究院成立起便開始探索 NLP 技術,而由于其天然具有人與計算機溝通橋梁的屬性,讓科大訊飛在探索感覺智能的同時也實作了認知智能的同步探索,并且在實作 NLP 技術落地的過程中,發現僅立足于技術去思考比對使用場景的方式,是很難行得通的。
是以,科大訊飛通過反複探索和複盤,摒棄了“拿着蘿蔔去找坑”的方式,探索出一個“基于實際業務場景和需求,反向倒逼技術打磨”的思路,最終成就了科大訊飛 AI 技術能夠迅速從研發到規模化落地的能力。
從技術應用角度來說,ChatGPT 并沒有顯著的創新性,出圈的原因主要在于選對了技術應用的落腳點。中國版 ChatGPT 在打造過程中,除了技術打磨以外,需要更豐富、更細化的場景反哺,同時在專業領域上,保持基于場景的資料疊代和核心技術的更新,才能“解鎖”更多技術的應用創新方式。
結合多年來在深度學習算法、大模型技術、行業大資料、知識圖譜、多模态感覺、系統工程技術方面優勢積累,形成了從核心技術到合作資源到資料疊代的綜合優勢,也為基于大模型的創新應用研發和試點推廣提供了場景保障。另外,基于其自主可控的核心技術底座,科大訊飛投身打造中國版 ChatGPT,有望能夠實作類似的技術階躍進步,在中文認知智能領域達到國際領先水準。
“1+N”核心技術底座,腳踏實地做科研
基于“訊飛超腦 2030 計劃”,科大訊飛面向複雜場景的多模感覺、多元表達、深 度了解、AI 運動智能算法等持續保持業界領先,國産化平台已常态化應用于 AI 算 法研發,實作核心技術底座自主可控。這意味着,無論未來技術發展出多少新的業務、新的應用場景,都可以基于該技術底座靈活應對。
比如,為了進一步提高大模型在細分行業的實用性,科大訊飛計劃采用“1+N”架構,基于“1”個通用認知智能大模型算法研發及高效訓練底座平台,應用于“N”個領域的專用大模型版本,包括教育、醫療、人機互動、辦公、汽車、翻譯、工業等多個行業。例如,通過學習海量醫學教材、論文和病例,實作專業的醫療領域對話式 AI 系統,打造“每個醫生的 AI 診療助理,每個人的 AI 健康助手”。
不過,盡管 ChatGPT 的出現讓 AI 領域和資本市場都處于相當熱血的狀态,劉聰表示,興奮歸興奮,關鍵在于踏踏實實把科研做好、把産品做好、把服務做好,最終回歸到人工智能紅利能否兌現的三大标準:
- 有沒有看得見摸得着的真實應用案例;
- 有沒有能夠規模化推廣應用的産品;
- 有沒有統計資料能夠證明應用成效。
劉聰真誠地表示,對于科大訊飛來說,本着 “實事求是”态度,緊跟國際最新發展,保持敬畏之心。同時在跟跑到并跑的同時要在一些擅長的領域做到領跑,如語音識别、翻譯、教育、醫療這些領域,依托行業知識和專業了解能力,形成規模使用者和商業模式的良性疊代。
CSDN 認為,在目前的 “ChatGPT 熱”下,我們在擁抱新的技術範式和技術潮流之餘,還需要結合場景來思考,找到适合的發展路徑和應用場景是關鍵。另外,正如劉聰院長所言,保持健康踏實的良性心态也非常重要。最後,發展中國版 ChatGPT 離不開各界齊心協力,一同建構美好開源架構和通用大模型的應用生态。