人人都有AI私人助手的時代來了！訊飛星火V4.0整體超越GPT-4 Turbo

IT時報記者孫妍

6月27日，科大訊飛釋出訊飛星火大模型V4.0，并宣布整體超越GPT-4 Turbo，在8個主流測試集中排名第一。

不僅在性能上比拼硬實力，科大訊飛還秀了一把生态的肌肉。在釋出會現場，科大訊飛第一次将汽車開上了舞台，昊鉑、魏牌、紅旗三款搭載星火座艙的智能汽車也占據了展廳的C位。衆所周知，科大訊飛是從語音識别起家，現今已能實作74個語種和方言的免切換對話，在多人同時說話等強幹擾場景下的識别難題也一并解決，将此雲邊端及軟硬一體化解決方案布局在汽車、家電、機器人等人機互動場景中。

大模型産品化一直是最能展現科大訊飛落地能力之處。此次，訊飛星火更新了App/Desk，在“個人空間”植入更懂使用者的AI助手。AI助手将無處不在，在教育中，它能變身為星火智能批閱機，幫老師批改作業；在學習中，它能變身為訊飛AI學習機，一對一答疑解惑；在醫療中，它能變身訊飛曉醫App，幫你看懂病曆和體檢報告，成為個人的AI健康助手……

而在“人工智能+”落地的最後一公裡，科大訊飛釋出星火企業智能體平台，推出星火商機助手、星火評标助手等智能體案例。這一切變化，都宣告着大模型個性化時代的到來！

毋庸置疑，國内AI大模型産業具有極強的生态落地能力，但是全世界都在關注，中國大模型的底座實力到底怎麼樣？從英偉達的斷供到Open AI的斷連，國産大模型深刻地認識到，“到底有沒有自主可控的國産底座能力做支撐，這決定了我們在這條路上到底能走多遠？人工智能浪潮相當于PC和網際網路的誕生，我們能不能成為美國之後全球智慧湧現的第二極？”科大訊飛董事長劉慶峰在釋出會開場，就抛出了兩個宏大的問題。

中國大模型底座實力幾何？

訊飛星火V4.0整體超越GPT-4 Turbo

訊飛星火大模型V4.0七大核心功能實作更新，全面對标GPT-4 Turbo，在本文生成、語言了解、知識問答、邏輯推理、數學能力等方面整體超越。

在國内外12項大模型主流測試集中，訊飛星火在8個測試集中排名第一，超越GPT-4 Turbo等國際大模型，也領先于國内大模型。

訊飛星火V4.0的圖文識别能力進步了，在科研、金融、醫療、司法、辦公等場景的應用效果已領先GPT-4o。針對長文檔知識問答的幻覺問題，訊飛星火在業界首發溯源功能，答案可以找到出處。

難得的是，訊飛星火大模型V4.0是基于全國首個國産萬卡算力叢集“飛星一号”訓練的，這也展現了訊飛星火底座的自主可控性。

自去年9月全面開放以來，訊飛星火App在安卓公開市場累計下載下傳量達1.31億次，在國内工具類通用大模型App中排名第一。今年618大促，星火大模型加持的智能硬體銷量同比增長超70%，月均使用次數超4000萬。

“Bob在客廳裡。他拿着一個杯子走到廚房。他把球放進杯子裡，然後拿着杯子走到卧室。他把杯子倒過來，然後走到花園。他把杯子放在花園裡，然後走到車庫。問題：球在什麼地方？”在現場，訊飛星火V4.0答對了這道較為複雜的空間推理題，答案是“球在卧室的地面上”。

從AI大模型到具身智能到底還有多遠？從AI大模型的空間推理“智商”就可見一斑。

數百萬硬體使用者一鍵擁有AI私人助手

AI助手被認為是第一個剛需的C端大模型應用場景，但現在的AI大模型已經夠格成為一位私人助手了嗎？

私人助手的第一要義是要“懂你”，劉慶峰提出，AI助手要基于使用者畫像進行個性化表達，基于使用曆史進行記憶學習，基于個人資料進行增強學習。

更新後的訊飛星火App新增“個人空間”，使用者可以上傳自己的工作、學習、生活、健康等各類資料，形成每個人的專屬知識庫，再設定人設，讓大模型成為你的“分身”。

科大訊飛研究院院長劉聰現場示範“個人空間”效果，當他上傳了女兒寫的小作文并選取符合女兒風格的AI人設标簽後，星火生成了一篇文風活潑，帶有可愛表情的文章；當他上傳了訊飛翻譯機的産品海報、使用者短視訊、相關錄音，星火也可以根據這些多模态資訊生成産品教育訓練文檔，還可以對生成的資訊進行多模态溯源。

更具意義的事，訊飛星火大模型打通了訊飛全系列C端硬體産品生态，數百萬智能硬體使用者将一鍵擁有“星火全家桶”。比如訊飛智能錄音筆、智能辦公本的檔案可以一鍵同步到星火個人空間，通過資料互通形成操作關聯，當你将一篇辦公本裡的會議記錄同步到星火個人空間後，就可以讓星火進行公文寫作，它還會幫你做PPT，生成待辦事項等。

74個語種方言“自由對話”

破解強幹擾場景下語音識别難題

在釋出會現場，有一幕示範讓觀衆捧腹大笑，又覺高能炸裂：三個人肩并肩站着，在非常近的距離下，三人互相不被幹擾地念着稿子，幾乎是用相同的分貝，正常人耳已經難以聽清，隻見訊飛星火不但将三人重疊的角色分離，還能實時準确地寫出每個人說的話。

這一幕背後的技術是基于多模态聲音識别，将應用在訊飛聽見智慧辦公、智慧屏等會議辦公産品中。

近期，科大訊飛作為第一完成機關的《多語種智能語音關鍵技術及産業化》項目，獲得國家科學技術進步獎一等獎。

釋出會上，科大訊飛再出“王炸”，宣布實作74個語種方言的“自由對話”，包含37個語種、37種方言。其中，37個語種識别效果領先OpenAI whisper-V3，37個方言識别效果平均提升30%。

基于此，科大訊飛又釋出了軟硬體一體的訊飛同傳系統，适用于大會、會議、展廳、旅遊等場景，參會者戴上耳機，就能實時收聽多語種的AI同聲傳譯。

下載下傳量超1200萬 AI“家庭醫生”成剛需

向C端全面開放以來，訊飛曉醫App成為AI剛需應用，累計下載下傳量1200萬，主動推薦率42%。

在醫療領域，訊飛星火醫療大模型的核心能力已經全面超過GPT-4 Turbo和GPT-4o。此次更新後，訊飛曉醫App覆寫1600種常見疾病、2800種常見藥品、6000種常見檢查檢驗，看病前、用藥時、檢查後都能用。

訊飛曉醫App也上線了“個人數字健康空間”，它能夠根據電子病曆、檢查報告、體檢報告等使用者資料，在看病前進一步剖析病症原因，用藥時給出藥物禁忌的個性判斷，在檢查後聯合對比給出資料變化，并通過角色切換，了解其他家庭成員的健康狀況。

至于使用者關注的資料安全問題，目前訊飛曉醫App已認證資料安全與隐私保護的多類權威認證。

在目前醫療資源相對匮乏的情況下，訊飛曉醫App等AI健康應用有效緩解了社會對醫療服務的迫切需求，讓每個人都能擁有“家庭醫生”。

“會做題的大模型” 助老師批作業負擔下降90%

今年中聯考真題實測中，訊飛星火語數外各科“成績”均排名領先。在科研上，訊飛星火助力中國科學技術大學劉海燕教授團隊，将蛋白質設計成功率從0.1%提升到20%，設計所需時間從6個月降到1天。它也賦能每個人，幫助一位不懂法律知識的70歲老人順利要回養老錢欠款、幫助一位聽障人士圓了文學夢······

那麼，這位“更會做題的大模型”會輔導學生嗎？訊飛AI學習機更新 AI 1對1 答疑輔導功能，既能進行多模态啟發式講解、自由問個性化解答，也可以進行互動探究式學習、超拟人引導式伴學等，讓孩子多了一位“AI輔學老師”。資料顯示，相比較傳統解題視訊學習，AI答疑輔導的學習方式讓孩子的學習完成率提高到90%，錯題解決率提升到93%。

一台列印機加上一個電腦螢幕的裝置，竟然是一台能幫老師批改作業的機器，15份學生作業，半分鐘批改完成。

将作業放進星火智能批閱機裡，它能自動掃描作業，不限紙張大小，模仿真人筆迹，吐出來的作業已經批改完成。

批改完後，它還能分析每位學生的掌握情況，形成學習報告，自動生成作業講解課件。有了這位AI助手，老師們再也不用憂慮作業批不完，原先要90分鐘才能批改完的作業，現在隻要5分鐘就能完成；人工分析學情要60分鐘，現在隻要1分鐘就能完成；在因材施教和科學分析下，學生的錯題解決率從50%提升到73%。

星火企業智能體打造每個崗位的專屬AI助手

除了開頭提到的星火座艙連接配接的奇瑞汽車、中國一汽、大衆汽車、江汽集團外，訊飛星火大模型正在為更多企業打造專屬AI助手，覆寫國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團、美的集團等多領域頭部企業。

在這些企業中，AI可能是會寫代碼的工程師，會打電話的客服，也可能負責合規審查、評标等。在交通銀行，星火大模型的代碼産品iFlyCode覆寫6000多名研發人員，代碼采納率達38%。

如何解決企業大模型應用的最後一公裡問題？星火企業智能體應運而生，已覆寫400多項AI原子能力，內建90多個外部信源，打通100多個内部IT系統，企業可以結合自身的業務場景快速落地智能體。32個企業智能體分布在生産域、科創域、辦公域、管理域等，可以即插即用。

為了給企業打個樣，科大訊飛打造了星火商機助手、星火評标助手等，星火商機助手可以實作商機線索應知盡知、客戶拜訪提質增效、銷售管理智能研判。星火評标助手通過标前尋源、智能評标、定标稽核等功能，智能評标結果人機一緻率達98%，投标異常檢出率超過80%，在大幅提升企業評标效率同時降低采購成本。

訊飛星火大模型到底好不好用？生态強不強大？從開發者數量可見一斑。從自今年1月30日釋出訊飛星火V3.5以來，短短5個月，星火開發者數量從598萬增長到702萬，海外開發者數量超40萬，大模型開發者達57萬。

劉慶峰說，隻有自主可控的繁榮生态，才有中國通用人工智能的大未來。面向未來的人工智能新生态，他強調要關注源頭技術生态、智能體生态、應用生态和行業生态，實作自主可控和軟硬一體，才能實作大模型的深度落地；既要科學理性地認識中美在大模型上的綜合差距，也要有信心快速追趕，給出從源頭技術、到産業生态、再到應用落地的一整套的打法，以長期主義來打造真正自主可控的AI産業生态。