天天看點

該冷靜認識一下ChatGPT和它的價值了

作者:随思錄

本來不想湊這個熱鬧,不過前兩天手欠寫了些評論,結果收到一些回複,感覺很多人對 ChatGPT的認知,更像是從科幻小說中推導出來的。是以想啰嗦幾句,聊聊圈内人對他的一些認識。

國内對于ChatGPT的分析,圈外的評論和報道多是老百姓的科幻想象和資本的狂熱追逐。且因為微軟ChatGPT的底層技術OpenAI并沒有完全公布其技術方案細節,是以大家更多的也是基于它的相關論文猜想。那麼我就用通俗一點的語言來講講圈内(行業内)對這個東西的評價。

首先要強調一點,類似GPT這種大模型,國内國外都在做。技術上各有特點。并不是好像突然被發明的,好像突然史詩般的給人類放了個大招,那些都是科幻小說看多了。但是這些技術向應用轉化是一件非常費錢的事(有一種擔憂,未來通用大模型AI可能隻會被少數國家的少數企業所壟斷),微軟的價值就在于它是第1個吃螃蟹的。

ChatGPT驚豔是因為邁過了圖靈測試這個分水嶺,像人了,甚至在某些方面比人還強。但離完善還差很遠,一些連部分人都不知道的東西,就不一定勉強它。至于其開發團隊不承認跨過了圖靈線,我了解隻是說沒有在各個領域全面通過圖靈線。即便如此,有能力在主要領域跨過了圖靈線,就證明全面跨過圖靈線隻是一個時間問題,換句話說就是OpenAI已經被證明具備了跨過圖靈線的能力。

我個人認為,跨過圖靈線的一個重要涵義就是機器能替代人的智力工作了。“圖靈線"就是“圖靈測試的分界線”的簡稱。圖靈給出的一個操作性定義:你分辨不出來是人還是機器在回答問題就是通過了圖靈測試。

給個例子,我們看到OpenAI确實對于分析人的語義,并按照人的知識組織回答方面是很成功的。但結果也能看到還不夠完善。

該冷靜認識一下ChatGPT和它的價值了

早期的人工智能使用了基于形式邏輯的規則推理機制,解決了大部分智能表現,産生了人工智能的一個發展高潮,決策支援可以實用。後來,面對新的瓶頸,提出了基于人工标注的語料庫的統計學輔助分析方法,統計學引發了再一次人工智能高潮,有限集下的語音識别,圖像識别基本可用。面對新的瓶頸,模仿人腦神經觸頭,建構了神經網絡,通過不斷地強化訓練學習逼近人腦工作模式,但是一直不能解釋。盡管如此,人工智能進步還是明顯的。後來,神經網絡的層次大幅度增加,優化學習的參數調試過程特别耗費,模型不斷變大,調優算法成為關鍵,算法改進步伐跟不上時代,接着算力提升用來補救。ChatGPT出世了。

ChatGPT依靠預訓練的大規模對話式的語義資料庫,生成機器與人的對話場景,ChatGPT生成的對話有一個精确度問題,對話語義資料庫參數量愈大,ChatGPT對話的精确度愈高,在不斷訓練疊代下,使ChatGPT生成的對話已分不清是機器在講還是人類在講,此時是否就達到了圖靈測試的分界線?!

一部分專家認為,GPT序列開發的大規模語義網絡預訓練的語義庫其庫容參數卻在不斷增加,是否是為了克服知識邏輯推理機制的缺陷,其庫容參數的增加有助于機器了解丶生成人類自然語言的能力。當然也有部分人認為他并沒有知識邏輯推理。

GPT-4有170萬億個參數,6層encoder-decoder每層兩個子層的複雜系統,我們隻能以簡馭繁,知識邏輯推理都太複雜了。

再引用GPT-4的技術報告:

GPT就是預測一個句子下一個單詞:P(x_n | x_n-1, x_n-2, ……),條件機率。沒有什麼“知識邏輯推理”。

"GPT-4 is a Transformer-based model pre-trained to predict the next token in a document."

按照台灣的一檔科普節目所講。ChatGPT就是單詞接龍。就是把一句句子的單詞一個一個通過AI方式接起來。當然這隻是語言輸出的方面,另一方面的語義了解我們還不得而知。

GPT一4有170萬億個參數,沒錯!GPT序列在發展中,參數量在增加中!

GPT(2018)1.17億參數,

GPT-2(2019)15億參數,

GPT-3(2020)1750億參數

我的觀點,參數量增加,在補償其缺乏知識推理機制的條件下,通過查詢大規模、經訓練、高參量的語義庫,也可提高機器生成自然語言的能力!

我們可以發現,OpenAI在推出ChatGPT或GPT-4時,總要說一句話:它們是基于機器學習或深度學習的,而這正屬于弱人工智能領域。有人也稱為人工公用智能AGI,或稱基于人工神經系統,這正是機器學習或深度學習(弱人工智能)的特點。GPT-4技術報告,在開頭的介紹篇中談到GPT-4的能力:結論是不如人類。談到專業學術水準時:表現人類水準。看來它還是一種過渡型的!其參數量還在增加中!

從人工智能發展的曆史,我們不難看出,在模型建立的情況下,算法和算力才是關鍵。從這個角度來說,微軟的openAI和百度的文心一言在模型上是類似的,在算力方面,微軟這些年投入巨資,基于它的雲平台Azure,可以提供很強的算力。百度在這方面雖然沒有微軟财大氣粗,投入也并不少。圈内人都知道北京的一個晶片獨角獸叫昆侖芯,其實就是百度孵化出獨立營運的算力晶片企業。在算法方面,美國多年的積累肯定是有一定優勢的,但中國的這些科技巨頭這些年的高投入差距不會很大。好的算法也是可以彌補算力不足的。是以從某種不很專業的角度來說,你把算力搞上去,把參數庫做大,出來的結果就會更好。就是要使勁投錢了。

微軟這次的出圈真正的意義是讓大家看到人工智能在一些更主要領域内落地的可能性。如果說ChatGPT隻是一個小玩具,那麼openAI作為這種人工智能的底層平台,支撐微軟将這種能力全面導入它所有的産品。我們從一些測試版可以看到,包括bing搜尋,浏覽器,office軟體,項目管理,開發工具,遊戲開發等等,讓使用者體驗和效率都上了一個大台階。給産業巨大的想象空間。國内在這方面肯定也會跟進,但恐怕真正的核心企業并不全是目前被炒作的那幾個。微軟更多起到了産業示範作用。

從資本市場的角度,我們應該理性看待ChatGPT,他确實給我們帶來了全新的應用體驗。但要将它完全落地,還需要時間。尤其是在國内,不盲目跟風炒作很重要,人工智能可以在許多領域落地,需要踏踏實實的去做。在這方面國内技術并不落後,這是社會應該認識到的,但将這些技術應用起來,則需要有挖掘更多的需求,投入更多的力量。即便對于微軟,我們說他走了一步好棋,那也是因為他家全套的生産力工具産品有這樣的需求,能夠産生相應的商業價值,微軟才會去大力投入。是以提高全社會的數字化水準,拉動這種需求,也是至關重要的。

非常反對媒體和資本市場的過度炒作,那些往往是為了迎合賭徒們收割普通投資者的計量。最後搞的資本市場一地雞毛,也無助于産業發展。

最後說一下我對人工智能的看法。對此有很多人恐慌,我是偏樂觀的,這是把人解放出來從事更有創造力的事,以及生活的享受。機械工作機器幹了,大部分智力工作也是機器幹了,一個人如果對生活的需求不到奢侈級别,可以不工作也有生活必需品供應,工作成為生活需求而不是生存需求,人依然需要在機器輔助下更深入研究世界(例如意識到底是什麼)、做更大的創新(例如接近光速的飛船)、更好地保護我們的軀體(永生?)、創造更好的藝術,人類會達到一個更美好的文明。#人工智能##科技圈大小事#

$百度(BIDU)$ $科大訊飛(SZ002230)$ $雲從科技-UW(SH688327)$