天天看點

ChatGPT之詳解基礎篇(一)

作者:chatGPT學社

ChatGPT之詳解基礎篇(一)

從本期開始,我将通過12期的内容全方位講解ChatGPT學習。

閑話不多說,現在開始喽!

ChatGPT之詳解基礎篇(一)
ChatGPT之詳解基礎篇(一)
ChatGPT之詳解基礎篇(一)

這期就介紹到這,最後我就來詳細科普一下什麼是ChatGPT?

大家或多或少都聽過 ChatGPT 是一個 LLMs,那 LLMs 是什麼?

LLMs 全稱是 Large Language Models,中文是大語言模型。

那麼什麼是語言模型?

語言模型簡單說來,就是對人類的語言建立數學模型,注意,這裡的關鍵是數學模型,語言模型是一個由數學公式建構的模型,并不是什麼邏輯架構。這個認知非常重要。

最早提出語言模型的概念的是賈裡尼克博士。

他是世界著名的語音識别和自然語言處理的專家,他在 IBM 實驗室工作期間,提出了基于統計的語音識别的架構,這個架構結構對語音和語言處理有着深遠的影響,它從根本上使得語音識别有實用的可能。

在賈裡尼克以前,科學家們把語音識别問題當作人工智能問題和模式比對問題,而賈裡尼克把它當成通信問題。

為何是通訊問題?為何轉換成通訊問題後,就能實作語音識别?

根據香農确定的現代通訊原理,所謂的通訊,也被稱為信道的編碼和解碼,資訊源先産生原始資訊,然後接收方還原一個和原始資訊最接近的資訊。

比如,你打電話的時候,問對方一句「你吃了晚飯了嗎」,在傳輸前,通訊系統會對這句話進行編碼,編成類似「100111101100000…」,但是傳輸過程中,一定會有信号損失,接收方收到的編碼可能是「1001111011000…」,此時我們就沒法解碼回原來的句子了。

那如何解決這個問題?

我們可以把與接收到的編碼「1001111011000…」類似的句子都羅列出來,可能的情況是:

•吃了晚飯了嗎?

•你吃了飯了嗎?

•你吃了晚飯了嗎?

•你吃了晚飯了?

然後通訊系統會計算出哪一種的可能性最大,最後把它選出來。

隻要噪音不大,并且傳輸資訊有備援,那我們就能複原出原來的資訊。

賈裡尼克博士認為讓計算機了解人類的語言,不是像教人那樣教它文法,而是最好能夠讓計算機計算出哪一種可能的語句機率最大。

這種計算自然語言每個句子的機率的數學模型,就是語言模型。

繼續閱讀