整體對标GPT-4 Turbo 科大訊飛劉慶峰稱應理性認識大模型綜合差距

本報記者陳佳岚廣州報道

OpenAI最新大模型版本GPT-4o釋出一個月，國内廠商科大訊飛就聲稱旗下大模型已在多方面能力對标GPT-4o了。

6月27日，科大訊飛釋出基于全國首個萬卡算力叢集“飛星一号”的星火大模型V4.0版本，該版本七大核心能力全面更新，其聲稱在文本生成、語言了解、知識問答、邏輯推理、數學能力等方面實作對GPT-4 Turbo的整體超越。

“訊飛星火大模型V4.0是在全國産算力平台上訓練的大模型，所有算法都是我們自主可控的，每一行碼、每一個資料都是我們自己編寫、自己清洗出來的大模型。”科大訊飛董事長劉慶峰表示，一定程度上，星火大模型V4.0的釋出對完全自主可控的大模型究竟走到了什麼樣的發展階段，具有重要的标志意義。

“我們多語言的語音識别原來需要1萬小時資料，現在隻要100小時資料就能做到比原來1萬小時還好的效果。”劉慶峰表示，在中國，一定要考慮用更小的算力、更小的資料，做出更優質的落地成果，這樣才能夠真正地在未來幾年打赢這一場人工智能紅利賦能産業的“仗”，但同時，整個社會還要加強源頭技術創新的氛圍，一定要看到中美之間的差距，才能夠迎頭趕上，絕不能盲目自信，盲目地認為我們都已經超越了。差距還是很大的，需要大家有充厘清晰而又理性的認知。

核心能力提升對标GPT-4 Turbo

ChatGPT作為領先的語言模型代表了目前人工智能領域的先進技術水準，國内大模型總喜歡與之一較高下，這不僅是國内大模型希望通過與ChatGPT競争提高自身的市場認知度和使用者基礎，背後也是中美大模型差距的較量，還可以減少對外部技術的依賴。

《中國經營報》記者注意到，對于科大訊飛而言，其訊飛星火大模型版本幾乎每次更疊都會與ChatGPT做對比，這次也不例外。OpenAI在上個月（5月14日）剛釋出了最新大模型版本GPT-4o，聚焦語言互動功能的提升，科大訊飛就迫不及待地要和GPT-4o進行PK了。

科大訊飛官方介紹，根據《通用認知智能大模型測評體系2.0》測試結果，訊飛星火V4.0已經實作了和GPT-4 Turbo的全面對标，在文本生成、語言了解、知識問答、邏輯推理、數學這些能力上都已經實作超越。

現場，劉慶峰展示了訊飛星火V4.0在複雜指令、複雜邏輯推理、空間推理、高中數學等方面的效果，星火“智商”再度進化。“複雜指令”現在得到了很好的提升，例如對标題使用修飾手法、需要引經據典的情況以及要用成語等，它都能了解，這就是“複雜指令”的跟随能力。

然而，科大訊飛也坦言訊飛星火V4.0在代碼和多模态能力上與GPT-4 Turbo還有差距。

劉慶峰表示，代碼能力是我們非常關注的能力之一，因為它涉及未來的産業資訊化和資訊産業化的核心。ChatGPT去年2月通過谷歌二級程式員測試，當時的GPT-3.5用這個測試集隻獲得了60多分。GPT-4 Turbo今年1月測試大概在80分，現在到86分，也在快速疊代和進步。預計在今年8月，訊飛星火會達到86分以上的水準。

而訊飛星火V4.0多模态能力與GPT-4 Turbo還有所差距，是因為我們目前在文生視訊上還沒有算力，也是下一步的核心重點，但是有生态夥伴一起做。

認識中美科技綜合差距、長期主義打造自主可控生态

“今天的訊飛星火V4.0對标GPT-4 Turbo是全方位對标，但是我們同時要看到，一旦GPT-5釋出，因為它的模型尺寸更大、訓練時間更長、資料更多，又會把差距拉開，甚至拉到一年以上。”劉慶峰坦承，,我們一定要科學理性地認識到中美科技的綜合差距。

在劉慶峰看來，中美在通用大模型底座上的差距，是半年到一年半之間的動态追趕，但不會被甩開。

他繼續說道：“我們有信心快速追趕，而且是在完全國産算力自主可控算法和資料基礎上來追趕，保證不出現代差，保證極限情況下，能夠頂上扛上。我們既要認識到差距，又要有充分的信心，要能夠科學理性地給出從源頭技術到生态到産業應用落地的一整套打法，要以長期主義來打造真正自主可控的AI産業生态。”

劉慶峰認為，面對未來的人工智能新生态，要關注源頭技術生态、智能體生态、應用生态、行業生态。在推動的過程中，一定要實作底座技術的完全自主可控，否則可能我們就把大樓建在别人的院子裡，建在沙灘上，随時會倒塌，要真正做到軟硬體一體化，才能更深度地落地。

記者注意到，劉慶峰多次強調要打造自主可控的AI産業生态的重要性。

2023年10月17日，英偉達應美國商務部要求，對中國所有能訓練大模型的智能算力全面斷供。近日，OpenAI在官方推送的郵件通知中明确指出，自7月9日起，将開始阻止來自非支援國家和地區的API流量包括來自中國的API申請。

在劉慶峰看來，從英偉達斷供先進人工智能晶片到OpenAI阻止中國地區的API流量，都是中美科技競争日益激烈背景下人工智能領域的博弈。在這一情況下，到底有沒有自主可控的國産底座能力做支撐，決定了大陸大模型在這條路上到底能走多遠。通用人工智能這波浪潮相當于PC和網際網路的誕生，在人類曆史上有深刻的意義，而我們能不能享受這波紅利，能不能成為美國之後全球智慧湧現的第二極？劉慶峰表示：“隻有自主可控的繁榮生态，才有中國通用人工智能的大未來。”

第三方咨詢機構Gartner稱，到2026年之前，全世界80%的企業都要用到通用AI ，今天這個數字是5%至10%。

很顯然，AI是新一輪科技革命和産業變革的重要驅動力量，将對全球經濟社會發展和人類文明進步産生深遠影響。中國企業要想在這波浪潮中分得大蛋糕，以長期主義打造真正自主可控的AI産業生态是一條重要路徑。

編輯：吳清稽核：李正豪校對：劉軍

整體對标GPT-4 Turbo 科大訊飛劉慶峰稱應理性認識大模型綜合差距

繼續閱讀

下一代AI大模型Grok 2，馬斯克公布時間

OpenAI開發大模型内容糾錯工具丨知乎推出AI搜尋産品「知乎直答」

賀蘭縣舉行2024年大型商業綜合體滅火救援實戰聯合演練

飛利浦、未野、飛科刮胡刀好用嗎？行業卷王綜合實測

缸瓦窯溝村黨支部與省委統戰部宗教綜合處黨支部開展主題黨日活動

售20.49萬！智己L6MAX标準版，純電動後驅，綜合表現如何？

呼市老年體協第六工委基層服務站老年人健身綜合展演活動在黑水泉村舉行

中國兩大高科技巨頭聯手，推出人工智能大模型，超越美國GPT-4！

一個有趣的問題，你覺得#哪家數位廠商喜歡悶聲幹大事#？[靈光一閃]我想很多人的答案都是華為吧？無論是硬體方面還是軟體系統

沙俄海軍綜合性能最好的“博加特裡”級防護巡洋艦

高中實體 | 力學中常見的九大實體模型，學起來！

臨港，古棕路城市功能綜合體，設計方案出爐

一升二數學暑假作業綜合卷60天每日一練（可下載下傳列印）

迎七一慶華誕 ——西充縣綜合執法局召開慶祝建黨103周年大會

ICML 2024 Spotlight | 在解碼中重新對齊，讓語言模型更少幻覺、更符合人類偏好

人類或永遠被“困”在地球？科學家：宇航員會出現神經眼肌綜合症