ChatGPT之詳解基礎篇(一)

作者：chatGPT學社 2023-07-06 10:05:00

ChatGPT之詳解基礎篇(一)

從本期開始，我将通過12期的内容全方位講解ChatGPT學習。

閑話不多說，現在開始喽！

這期就介紹到這，最後我就來詳細科普一下什麼是ChatGPT？

大家或多或少都聽過 ChatGPT 是一個 LLMs，那 LLMs 是什麼？

LLMs 全稱是 Large Language Models，中文是大語言模型。

那麼什麼是語言模型？

語言模型簡單說來，就是對人類的語言建立數學模型，注意，這裡的關鍵是數學模型，語言模型是一個由數學公式建構的模型，并不是什麼邏輯架構。這個認知非常重要。

最早提出語言模型的概念的是賈裡尼克博士。

他是世界著名的語音識别和自然語言處理的專家，他在 IBM 實驗室工作期間，提出了基于統計的語音識别的架構，這個架構結構對語音和語言處理有着深遠的影響，它從根本上使得語音識别有實用的可能。

在賈裡尼克以前，科學家們把語音識别問題當作人工智能問題和模式比對問題，而賈裡尼克把它當成通信問題。

為何是通訊問題？為何轉換成通訊問題後，就能實作語音識别？

根據香農确定的現代通訊原理，所謂的通訊，也被稱為信道的編碼和解碼，資訊源先産生原始資訊，然後接收方還原一個和原始資訊最接近的資訊。

比如，你打電話的時候，問對方一句「你吃了晚飯了嗎」，在傳輸前，通訊系統會對這句話進行編碼，編成類似「100111101100000…」，但是傳輸過程中，一定會有信号損失，接收方收到的編碼可能是「1001111011000…」，此時我們就沒法解碼回原來的句子了。

那如何解決這個問題？

我們可以把與接收到的編碼「1001111011000…」類似的句子都羅列出來，可能的情況是：

•吃了晚飯了嗎?

•你吃了飯了嗎?

•你吃了晚飯了嗎?

•你吃了晚飯了?

然後通訊系統會計算出哪一種的可能性最大，最後把它選出來。

隻要噪音不大，并且傳輸資訊有備援，那我們就能複原出原來的資訊。

賈裡尼克博士認為讓計算機了解人類的語言，不是像教人那樣教它文法，而是最好能夠讓計算機計算出哪一種可能的語句機率最大。

這種計算自然語言每個句子的機率的數學模型，就是語言模型。

繼續閱讀