天天看點

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

作者:休閑荒野

IT時報記者 孫妍

6月27日,科大訊飛釋出訊飛星火大模型V4.0,并宣布整體超越GPT-4 Turbo,在8個主流測試集中排名第一。

不僅在性能上比拼硬實力,科大訊飛還秀了一把生态的肌肉。在釋出會現場,科大訊飛第一次将汽車開上了舞台,昊鉑、魏牌、紅旗三款搭載星火座艙的智能汽車也占據了展廳的C位。衆所周知,科大訊飛是從語音識别起家,現今已能實作74個語種和方言的免切換對話,在多人同時說話等強幹擾場景下的識别難題也一并解決,将此雲邊端及軟硬一體化解決方案布局在汽車、家電、機器人等人機互動場景中。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

大模型産品化一直是最能展現科大訊飛落地能力之處。此次,訊飛星火更新了App/Desk,在“個人空間”植入更懂使用者的AI助手。AI助手将無處不在,在教育中,它能變身為星火智能批閱機,幫老師批改作業;在學習中,它能變身為訊飛AI學習機,一對一答疑解惑;在醫療中,它能變身訊飛曉醫App,幫你看懂病曆和體檢報告,成為個人的AI健康助手……

而在“人工智能+”落地的最後一公裡,科大訊飛釋出星火企業智能體平台,推出星火商機助手、星火評标助手等智能體案例。這一切變化,都宣告着大模型個性化時代的到來!

毋庸置疑,國内AI大模型産業具有極強的生态落地能力,但是全世界都在關注,中國大模型的底座實力到底怎麼樣?從英偉達的斷供到Open AI的斷連,國産大模型深刻地認識到,“到底有沒有自主可控的國産底座能力做支撐,這決定了我們在這條路上到底能走多遠?人工智能浪潮相當于PC和網際網路的誕生,我們能不能成為美國之後全球智慧湧現的第二極?”科大訊飛董事長劉慶峰在釋出會開場,就抛出了兩個宏大的問題。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

中國大模型底座實力幾何?

訊飛星火V4.0整體超越GPT-4 Turbo

訊飛星火大模型V4.0七大核心功能實作更新,全面對标GPT-4 Turbo,在本文生成、語言了解、知識問答、邏輯推理、數學能力等方面整體超越。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

在國内外12項大模型主流測試集中,訊飛星火在8個測試集中排名第一,超越GPT-4 Turbo等國際大模型,也領先于國内大模型。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

訊飛星火V4.0的圖文識别能力進步了,在科研、金融、醫療、司法、辦公等場景的應用效果已領先GPT-4o。針對長文檔知識問答的幻覺問題,訊飛星火在業界首發溯源功能,答案可以找到出處。

難得的是,訊飛星火大模型V4.0是基于全國首個國産萬卡算力叢集“飛星一号”訓練的,這也展現了訊飛星火底座的自主可控性。

自去年9月全面開放以來,訊飛星火App在安卓公開市場累計下載下傳量達1.31億次,在國内工具類通用大模型App中排名第一。今年618大促,星火大模型加持的智能硬體銷量同比增長超70%,月均使用次數超4000萬。

“Bob在客廳裡。他拿着一個杯子走到廚房。他把球放進杯子裡,然後拿着杯子走到卧室。他把杯子倒過來,然後走到花園。他把杯子放在花園裡,然後走到車庫。問題:球在什麼地方?”在現場,訊飛星火V4.0答對了這道較為複雜的空間推理題,答案是“球在卧室的地面上”。

從AI大模型到具身智能到底還有多遠?從AI大模型的空間推理“智商”就可見一斑。

數百萬硬體使用者 一鍵擁有AI私人助手

AI助手被認為是第一個剛需的C端大模型應用場景,但現在的AI大模型已經夠格成為一位私人助手了嗎?

私人助手的第一要義是要“懂你”,劉慶峰提出,AI助手要基于使用者畫像進行個性化表達,基于使用曆史進行記憶學習,基于個人資料進行增強學習。

更新後的訊飛星火App新增“個人空間”,使用者可以上傳自己的工作、學習、生活、健康等各類資料,形成每個人的專屬知識庫,再設定人設,讓大模型成為你的“分身”。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

科大訊飛研究院院長劉聰現場示範“個人空間”效果,當他上傳了女兒寫的小作文并選取符合女兒風格的AI人設标簽後,星火生成了一篇文風活潑,帶有可愛表情的文章;當他上傳了訊飛翻譯機的産品海報、使用者短視訊、相關錄音,星火也可以根據這些多模态資訊生成産品教育訓練文檔,還可以對生成的資訊進行多模态溯源。

更具意義的事,訊飛星火大模型打通了訊飛全系列C端硬體産品生态,數百萬智能硬體使用者将一鍵擁有“星火全家桶”。比如訊飛智能錄音筆、智能辦公本的檔案可以一鍵同步到星火個人空間,通過資料互通形成操作關聯,當你将一篇辦公本裡的會議記錄同步到星火個人空間後,就可以讓星火進行公文寫作,它還會幫你做PPT,生成待辦事項等。

74個語種方言“自由對話”

破解強幹擾場景下語音識别難題

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

在釋出會現場,有一幕示範讓觀衆捧腹大笑,又覺高能炸裂:三個人肩并肩站着,在非常近的距離下,三人互相不被幹擾地念着稿子,幾乎是用相同的分貝,正常人耳已經難以聽清,隻見訊飛星火不但将三人重疊的角色分離,還能實時準确地寫出每個人說的話。

這一幕背後的技術是基于多模态聲音識别,将應用在訊飛聽見智慧辦公、智慧屏等會議辦公産品中。

近期,科大訊飛作為第一完成機關的《多語種智能語音關鍵技術及産業化》項目,獲得國家科學技術進步獎一等獎。

釋出會上,科大訊飛再出“王炸”,宣布實作74個語種方言的“自由對話”,包含37個語種、37種方言。其中,37個語種識别效果領先OpenAI whisper-V3,37個方言識别效果平均提升30%。

基于此,科大訊飛又釋出了軟硬體一體的訊飛同傳系統,适用于大會、會議、展廳、旅遊等場景,參會者戴上耳機,就能實時收聽多語種的AI同聲傳譯。

下載下傳量超1200萬 AI“家庭醫生”成剛需

向C端全面開放以來,訊飛曉醫App成為AI剛需應用,累計下載下傳量1200萬,主動推薦率42%。

在醫療領域,訊飛星火醫療大模型的核心能力已經全面超過GPT-4 Turbo和GPT-4o。此次更新後,訊飛曉醫App覆寫1600種常見疾病、2800種常見藥品、6000種常見檢查檢驗,看病前、用藥時、檢查後都能用。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

訊飛曉醫App也上線了“個人數字健康空間”,它能夠根據電子病曆、檢查報告、體檢報告等使用者資料,在看病前進一步剖析病症原因,用藥時給出藥物禁忌的個性判斷,在檢查後聯合對比給出資料變化,并通過角色切換,了解其他家庭成員的健康狀況。

至于使用者關注的資料安全問題,目前訊飛曉醫App已認證資料安全與隐私保護的多類權威認證。

在目前醫療資源相對匮乏的情況下,訊飛曉醫App等AI健康應用有效緩解了社會對醫療服務的迫切需求,讓每個人都能擁有“家庭醫生”。

“會做題的大模型” 助老師批作業負擔下降90%

今年中聯考真題實測中,訊飛星火語數外各科“成績”均排名領先。在科研上,訊飛星火助力中國科學技術大學劉海燕教授團隊,将蛋白質設計成功率從0.1%提升到20%,設計所需時間從6個月降到1天。它也賦能每個人,幫助一位不懂法律知識的70歲老人順利要回養老錢欠款、幫助一位聽障人士圓了文學夢······

那麼,這位“更會做題的大模型”會輔導學生嗎?訊飛AI學習機更新 AI 1對1 答疑輔導功能,既能進行多模态啟發式講解、自由問個性化解答,也可以進行互動探究式學習、超拟人引導式伴學等,讓孩子多了一位“AI輔學老師”。資料顯示,相比較傳統解題視訊學習,AI答疑輔導的學習方式讓孩子的學習完成率提高到90%,錯題解決率提升到93%。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

一台列印機加上一個電腦螢幕的裝置,竟然是一台能幫老師批改作業的機器,15份學生作業,半分鐘批改完成。

将作業放進星火智能批閱機裡,它能自動掃描作業,不限紙張大小,模仿真人筆迹,吐出來的作業已經批改完成。

批改完後,它還能分析每位學生的掌握情況,形成學習報告,自動生成作業講解課件。有了這位AI助手,老師們再也不用憂慮作業批不完,原先要90分鐘才能批改完的作業,現在隻要5分鐘就能完成;人工分析學情要60分鐘,現在隻要1分鐘就能完成;在因材施教和科學分析下,學生的錯題解決率從50%提升到73%。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo

星火企業智能體 打造每個崗位的專屬AI助手

除了開頭提到的星火座艙連接配接的奇瑞汽車、中國一汽、大衆汽車、江汽集團外,訊飛星火大模型正在為更多企業打造專屬AI助手,覆寫國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團、美的集團等多領域頭部企業。

在這些企業中,AI可能是會寫代碼的工程師,會打電話的客服,也可能負責合規審查、評标等。在交通銀行,星火大模型的代碼産品iFlyCode覆寫6000多名研發人員,代碼采納率達38%。

如何解決企業大模型應用的最後一公裡問題?星火企業智能體應運而生,已覆寫400多項AI原子能力,內建90多個外部信源,打通100多個内部IT系統,企業可以結合自身的業務場景快速落地智能體。32個企業智能體分布在生産域、科創域、辦公域、管理域等,可以即插即用。

為了給企業打個樣,科大訊飛打造了星火商機助手、星火評标助手等,星火商機助手可以實作商機線索應知盡知、客戶拜訪提質增效、銷售管理智能研判。星火評标助手通過标前尋源、智能評标、定标稽核等功能,智能評标結果人機一緻率達98%,投标異常檢出率超過80%,在大幅提升企業評标效率同時降低采購成本。

訊飛星火大模型到底好不好用?生态強不強大?從開發者數量可見一斑。從自今年1月30日釋出訊飛星火V3.5以來,短短5個月,星火開發者數量從598萬增長到702萬,海外開發者數量超40萬,大模型開發者達57萬。

劉慶峰說,隻有自主可控的繁榮生态,才有中國通用人工智能的大未來。面向未來的人工智能新生态,他強調要關注源頭技術生态、智能體生态、應用生态和行業生态,實作自主可控和軟硬一體,才能實作大模型的深度落地;既要科學理性地認識中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術、到産業生态、再到應用落地的一整套的打法,以長期主義來打造真正自主可控的AI産業生态。

人人都有AI私人助手的時代來了!訊飛星火V4.0整體超越GPT-4 Turbo