近日,2023年度國家科學技術獎在北京揭曉,科大訊飛(002230.SZ)牽頭的“多語種智能語音關鍵技術及産業化”項目摘獲國家科學技術進步獎一等獎。這是過去十年人工智能領域首個國家科學技術進步獎一等獎。在19項國家科學技術進步獎特等獎、一等獎中,科大訊飛也是唯一作為牽頭機關獲獎的民營企業。
激烈競争下脫穎而出
據了解,國家科學技術獎每年評選一次,一般在次年1月舉行的國家科技獎勵大會上公布結果。但2021年的國家科技獎勵大會推遲了10個月才舉行。此後兩年,國家科學技術獎的評選工作按下暫停鍵,直到2023年底才獲重新開機。
伴随評選重新開機的,是一系列變化。在官方通報中,此次評獎重點工作的第一項,就是“堅持‘四個面向(即堅持面向世界科技前沿、面向經濟主戰場、面向國家重大需求、面向人民生命健康)’,把服務國家重大戰略需求并作出創造性貢獻作為提名和評審的重要原則,圍繞國家戰略需要,優化評審組設定和評審委員會專家構成,強化重點領域”。
重新開機之後的國家科學技術獎,競争異常激烈。由于2021年和2022年國家科學技術獎暫停申報,各領域積累了大量具有突破性和創新性的科研成果,到了2023年度,僅“國家科學技術進步獎”這一類别,提名階段就有700多個項目角逐。
“粗略計算,國家科學技術進步獎的平均通過率僅有18.62%。”一位業内人士表示。
值得注意的是,競争雖然激烈,但相較于往年大多國家科技獎的牽頭者為清華大學、中國科學院等高校院所,今年的獲獎名單中,市場主體角色越來越重。科大訊飛、比亞迪、海爾等企業均作為第一完成機關摘得獎項。
其中,科大訊飛牽頭的“多語種智能語音關鍵技術及産業化”項目摘獲國家科學技術進步獎一等獎。科大訊飛也成為19項國家科學技術進步獎特等獎、一等獎中唯一作為牽頭機關獲獎的民營企業。
這也令整個中國人工智能領域側目。“科大訊飛獲獎是深度學習引發全球人工智能浪潮以來,過去十年人工智能領域首個國家科學技術進步獎一等獎。”一位人工智能業内人士稱。
此次科大訊飛所獲國家科學技術進步獎一等獎隸屬于“計算機與自動控制組”,該組别一直競争激烈。2020年評選中,該組别“一等獎空缺”。
2024年2月7日,國家科學技術獎勵工作辦公室釋出《國家科學技術獎勵工作辦公室公告第98号》,公告顯示形式審查合格予以受理的科技進步獎通用項目709項。其中,資訊領域相關的科技進步獎參選者有86項,包括華為陳海波牽頭的“鴻蒙智能終端提作系統基座與産業應用”、百度王海峰牽頭的“産業級深度學習開源開放平台”、曙光曆軍牽頭的“國産先進計算系統關鍵技術及應用”等。這其中屬于計算機與自動控制組的共有45項。
2024年4月8日,科學技術部再釋出《國家科學技術獎勵工作辦公室公告第100号》,初評共通過國家科學技術進步獎通用項目132項。計算機與自動控制組中,初評建議等級為一等獎的僅剩2項。
最終,2023年度國家科學技術進步獎評出特等獎3項,一等獎16項。科大訊飛牽頭的“多語種智能語音關鍵技術及産業化項目”成功拿下獎項。
值得注意的是,該組别上一個獲得一等獎的人工智能項目可能還要追溯到2001年,由北京漢王科技有限公司主導的“漢王形變連筆的手寫識别方法與系統”。
“國家科學技術進步獎是大陸科學技術領域的最高獎項,對企業來說,獲得這一獎項不僅是對其研發實力和技術水準的權威認可,還能推動背後産業的技術進步和創新。”一位資深投資人說。
堅持國家戰略導向
在本次獎勵大會召開的一個月前,《國家科技獎勵條例》迎來自1999年頒布以來的第4次修改。
修改後的條例,突出強調了黨中央對國家科技獎勵工作的集中統一上司,并在“國家科學技術獎應當與國家重大戰略需要和中長期科技發展規劃緊密結合”前,補充了一句“應當堅持國家戰略導向”。
2017年,國務院印發《新一代人工智能發展規劃》(國發〔2017〕35号)(以下簡稱《規劃》),确立了“三步走”目标:到2020年人工智能總體技術和應用與世界先進水準同步;到2025年人工智能基礎理論實作重大突破、部分技術與應用達到世界領先水準;到2030年人工智能理論、技術與應用總體達到世界領先水準,成為世界主要人工智能創新中心。
“多語種智能語音關鍵技術及産業化,在一定程度上完成了《規劃》中提出的‘技術與應用部分達到世界領先水準’的目标。”科大訊飛研究院副院長高建清表示。
高建清稱,該項目包含多語種語音識别、多語種語音合成、多語種翻譯技術等為一體的綜合技術,除了支援6個聯合國通用語種,還包括挪威語、丹麥語等小語種63個。同時,該項目還覆寫了維、藏、蒙、哈、朝、壯、彜等24種少數民族語言和中國方言,未來還将覆寫更多方言。
“持續攻關多年,科大訊飛攻克了多個技術難題。”高建清表示。其中,最大的創新點是“複雜語音信号解耦模組化”“多語種共享模組化”“語音語義聯合模組化”和“國産異構硬體平台訓練及推理”。
另一方面,多語種技術也是中國企業加速出海的必備“利器”。
科大訊飛的“多語種智能語音關鍵技術及産業化”在華為手機的出海中發揮重要作用,近兩年則在中國新能源汽車出海的浩蕩程序中成為技術優勢。
2023年,中國成為汽車出海第一大國。中國汽車出海10強企業中有8強和科大訊飛合作,已覆寫23個語種,出口60餘個國家。訊飛的車載智能化産品已累計前裝超5300萬套,支援奇瑞、一汽、長安等車企超200萬套訂單出海。
憑借自主可控的多語種産業生态,科大訊飛的多語種智能語音技術不僅開創引領中國語音産業快速發展,更支撐中國智能制造産業不斷更新,提升出海優勢,并助力打破全球語言障礙。
搶入大模型時代
事實上,科大訊飛在25年的曆史中共獲得3次國家科學技術獎。前面兩次分别是:“KD系列漢國文語轉換系統”獲2002年度國家科技進步二等獎;“智能語音互動關鍵技術及應用開發平台”獲得2011年度國家科技進步二等獎。
2002年獲獎是源于漢語語音合成技術的關鍵突破。中文文本實時轉換成漢語國語語音輸出,合成的語音自然流暢,整體技術達到了國際領先水準;産品已應用于中國電信語音網際網路、中國移動語音門戶、電力、金融呼叫中心、手機、車載GPS、軍工等衆多領域,取得重大經濟效益和社會效益。
2011年獲獎則是因為訊飛語音合成、語音識别、語音評測以及語音工程等應用方向開展了一系列創新研究,多項核心關鍵技術取得突破并達到國際領先水準,并研發和完善了應用開發平台。相關産品在電信、金融、教育、交通、政府等社會各行業普及應用,并助力奧運、世博等重大工程。
“前兩次獲獎,代表着我們的技術突破都有效防範了發達國家和跨國公司對大陸語音産業的壟斷風險,推動了大陸民族語音産業的整體發展,保障了大陸在智能語音互動技術與産業中的主導權。”科大訊飛董事長劉慶峰表示。
從2022年底開始,人工智能熱潮席卷全球,以ChatGPT為代表的大模型發展如火如荼。大模型展現出的強大通用人工智能能力,已成為人工智能發展中裡程碑式的進展,被認為将重塑人類社會的生産生活方式。
科大訊飛在兩度拿下二等獎後,一舉斬獲人工智能領域國家科學技術進步一等獎,也釋放出明顯的信号。
“科大訊飛多語種智能語音關鍵技術中的創新和大模型技術互相補充、互相促進。”科大訊飛相關人士表示。
數日前,科大訊飛剛在北京釋出訊飛星火大模型4.0及相關落地應用。在國内外12項大模型主流測試集中,訊飛星火大模型4.0在8個測試集中排名第一,超越GPT-4 Turbo等國際大模型。
大模型技術可以在複雜語義了解、長文本模組化能力上進一步提升語音識别、合成和翻譯的效果,同時基于其強大的語義了解、知識問答、多輪對話、多模态模組化能力,也能進一步大幅提升智能語音技術的使用場景和應用價值,支撐實作語音同傳、自動客服、輔學答疑、家庭醫生、虛拟員工、陪伴機器人、服務機器人等等未來智能産品創新,加速通用人工智能時代的到來。
劉慶峰稱,應由國家級權威機構和行業龍頭企業聯合,共同釋出具有公信力的大模型評測标準和應用指南,并定期組織系統全面的科學評測,指導各行業甄别和選用大模型。“我建議首批可以加快開發面向金融、工業、汽車、文旅、政務、教育、醫療等關鍵行業和領域的應用場景,加快打造标杆示範,在驗證成效後向全國規模化推廣。”
來源:新華社