天天看點

國産最強大模型釋出,訊飛星火V4.0整體超越GPT-4 Turbo

作者:牛刀财經
國産最強大模型釋出,訊飛星火V4.0整體超越GPT-4 Turbo

文丨周超然

出品丨牛刀财經(niudaocaijing)

國内大模型正在面臨尖峰時刻。

沖突沖突來看,OpenAI的斷連,将直接攪動大模型格局的座次變化;行業大環境來看,從通用大模型到垂直落地的加速,這也帶來生态位的競争加劇。

沿着這兩個方向我們看觀察國内大模型的發展,訊飛星火大模型表現突出。

尤其是,訊飛星火V4.0的釋出,以整體超越GPT-4 Turbo的成績,表明了國内大模型格局正在發生變化。

1、國産最強大模型釋出

訊飛星火V4.0來了!

6月27日,科大訊飛在北京釋出訊飛星火大模型V4.0及相關落地應用。訊飛星火V4.0七大核心能力全面提升,整體超越GPT-4 Turbo,在8個國際主流測試集中排名第一,國内大模型全面領先。

現場基于全國首個國産萬卡算力叢集“飛星一号”,訊飛星火大模型V4.0正式釋出。訊飛星火V4.0 七大核心能力全面更新,全面對标GPT-4 Turbo,并實作在文本生成、語言了解、知識問答、邏輯推理、數學能力等方面的整體超越。

國産最強大模型釋出,訊飛星火V4.0整體超越GPT-4 Turbo

訊飛星火V4.0在圖文識别能力上進一步更新,在科研、金融、醫療、司法、辦公等場景的應用效果已領先GPT-4o。

值得關注的是,關于市場較為關注的長文本處理能力,星火也全新更新,并針對長文檔知識問答的幻覺問題,業界首發溯源功能。

有意思的是,今年中聯考成為了檢測大模型的試金石。今年中聯考真題實測中,訊飛星火語數外各科“成績”均排名第一,被評為“更會做題的大模型”。

外部權威測試集也展現出訊飛星火V4.0的領先性。

在國内外12項大模型主流測試集中,訊飛星火在8個測試集中排名第一,超越GPT-4 Turbo等國際大模型,國内大模型全面領先。

現場,科大訊飛董事長劉慶峰展示了訊飛星火V4.0在複雜指令、複雜邏輯推理、空間推理、高中數學等方面的效果,星火“智商”再度進化。

以空間推理為例,現場示範提問中,“Bob在客廳裡。他拿着一個杯子走到廚房。他把球放進杯子裡,然後拿着杯子走到卧室。他把杯子倒過來,然後走到花園。他把杯子放在花園裡,然後走到車庫。問題:球在什麼地方?”訊飛星火可以基于空間和常識推斷出球在卧室的地面上,這些能力的進步對于以後的具身智能、家庭機器人都具有意義。

2、垂直落地加速

正如上文所說,國産大模型現在正在朝着兩個方向加速發展,一個是通用大模型的整體性能,一個是大模型的落地能力。

在應用場景上,訊飛星火V4.0也接連給市場帶來了驚喜。

釋出會上,訊飛星火進行了多款産品的釋出和更新。

訊飛星火APP/Desk全新更新,釋出“個人空間”,打造更懂你的AI助手;面向專業領域的個性化應用,科大訊飛更新訊飛曉醫APP,上線個人數字健康空間,打造每個人的健康助手;業界首發星火智能批閱機,“AI助教”助力老師減負增效、因材施教;訊飛AI學習機更新1對1答疑輔導功能,打造每個孩子的AI學習助手。

訊飛星火APP率先釋出“個人空間”,使用者可以上傳自己的工作、學習、生活、健康等各類資料,形成每個人的專屬知識庫,再結合人設,讓大模型生成更個性化内容。此外,訊飛星火首批上線14 個智能體,面向特定場景打造專屬助手。

訊飛曉醫APP各項能力持續更新,覆寫1600種常見疾病、2800種常見藥品、6000種常見檢查檢驗,滿足使用者在看病前、用藥時、檢查後的核心場景健康需求。目前,訊飛曉醫APP累計下載下傳量1200萬,使用者好評率98.8%,主動推薦率42%。

國産最強大模型釋出,訊飛星火V4.0整體超越GPT-4 Turbo

星火智能批閱機集智能批改、精準學情、個性學習于一體,它支援自由排版,不限紙張大小的作業,在支援多學科多題型智能批改的同時,還能即時生成多元學情報告,還為老師作業講評和面批輔導提供了素材。

在現場,示範了星火智能批閱機批改作業的全流程,15份學生作業半分鐘就能批改完成,批改模拟了真人筆迹,和老師平時批改作業幾乎一樣。

此外,星火大模型還打通了全系訊飛C端軟硬體産品生态,數百萬智能硬體使用者一鍵擁有“星火全家桶”。

比如訊飛智能辦公本、智能錄音筆的檔案可以一鍵同步到星火個人空間中,通過資料互通、操作關聯,把一篇辦公本裡會議記錄同步到星火中,就可以讓星火進行公文寫作,還可以做PPT,以及生成待辦事項等,帶來更高效的辦公體驗。

3、商業化加速

衆所周知,科大訊飛從AI語音處理起家,經過多年的發展,在智能語音處理上處于國際頂尖級别。

近期科大訊飛作為第一完成機關的《多語種智能語音關鍵技術及産業化》項目,獲得國家科學技術進步獎一等獎。釋出會現場國獎得主再出“王炸”,星火語音大模型迎來新突破。

當然,科大訊飛不僅有着長期的技術積累,還在商業化應用上早已成熟。

首先是人機互動領域。

在大模型加持下,星火汽車智能座艙全新更新,不但具備了多語種多方言的“自由互動”,還具備多情感多模态的超拟人互動,讓人車互動更有溫度。目前,訊飛語音互動産品國内市占率穩居第一,同時廣泛出口到世界各地。星火大模型為一汽、奇瑞、廣汽、江淮、長城等車企的衆多車型,賦予了高度智能的互動體驗。

為了讓大模型更好落地,科大訊飛還打造了雲邊端一體化和軟硬體一體化的解決方案,賦能家電、營運商、機器人等更多行業場景。面向具身智能和人形機器人企業需求,本次科大訊飛正式釋出機器人超腦平台2.0,業内首個支援多模态互動。目前,400+機器人企業已經采用訊飛機器人超腦平台。

其次是訊飛星火大模型釋出後,給企業生産帶來的高效受到市場認可。

自去年5月6日釋出以來,訊飛星火大模型正成為國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、奇瑞汽車、中國一汽、大衆汽車、江汽集團、海爾集團、美的集團等多領域頭部企業的首選。

訊飛星火已經在代碼、合規審查、客服、評标、智能互動等多個典型場景産生應用成效,以交通銀行為例,基于星火大模型能力的産品iFlyCode覆寫6000+研發人員,代碼采納率達38%,工作效率顯著提升。

國産最強大模型釋出,訊飛星火V4.0整體超越GPT-4 Turbo

此次釋出會,星火企業智能體平台正式釋出,圍繞搭建智能體的三大關鍵能力,目前企業智能體平台已覆寫400+AI原子能力,內建90+外部信源,打通100+内部IT系統,可供企業結合業務場景快速建構可落地的智能體應用。平台還圍繞生産域、科創域、辦公域、管理域上線32個企業智能體,供企業即插即用。

比如在代碼智能體iFlyCode中,它內建了代碼生成助手、架構設計助手、代碼問答助手、測試助手、資料庫優化助手、代碼稽核助手等六大場景智能體,将采納率由30%提升至52%,大幅度提升企業智能體的實用性。

訊飛星火大模型在給産業帶來效率提升的同時,也為大模型生态帶來助力。

自今年1月30日訊飛星火V3.5釋出以來,短短5個月,星火開發者生态加速增長,開發者數從598萬增長到702萬,新增超104萬;海外開發者數超40萬;大模型開發者達57萬。越來越多開發者正加入星火生态,釋放更多剛需場景的應用價值。

劉慶峰表示,隻有自主可控的繁榮生态,才有中國通用人工智能的大未來。

面向未來的人工智能新生态,他強調要關注源頭技術生态、智能體生态、應用生态和行業生态,實作自主可控和軟硬一體,才能實作大模型的深度落地;既要科學理性地認識中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術、到産業生态、再到應用落地的一整套的打法,以長期主義來打造真正自主可控的AI産業生态。

繼續閱讀