近日,2023年度国家科学技术奖在北京揭晓,科大讯飞(002230.SZ)牵头的“多语种智能语音关键技术及产业化”项目摘获国家科学技术进步奖一等奖。这是过去十年人工智能领域首个国家科学技术进步奖一等奖。在19项国家科学技术进步奖特等奖、一等奖中,科大讯飞也是唯一作为牵头单位获奖的民营企业。
激烈竞争下脱颖而出
据了解,国家科学技术奖每年评选一次,一般在次年1月举行的国家科技奖励大会上公布结果。但2021年的国家科技奖励大会推迟了10个月才举行。此后两年,国家科学技术奖的评选工作按下暂停键,直到2023年底才获重启。
伴随评选重启的,是一系列变化。在官方通报中,此次评奖重点工作的第一项,就是“坚持‘四个面向(即坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康)’,把服务国家重大战略需求并作出创造性贡献作为提名和评审的重要原则,围绕国家战略需要,优化评审组设置和评审委员会专家构成,强化重点领域”。
重启之后的国家科学技术奖,竞争异常激烈。由于2021年和2022年国家科学技术奖暂停申报,各领域积累了大量具有突破性和创新性的科研成果,到了2023年度,仅“国家科学技术进步奖”这一类别,提名阶段就有700多个项目角逐。
“粗略计算,国家科学技术进步奖的平均通过率仅有18.62%。”一位业内人士表示。
值得注意的是,竞争虽然激烈,但相较于往年大多国家科技奖的牵头者为清华大学、中国科学院等高校院所,今年的获奖名单中,市场主体角色越来越重。科大讯飞、比亚迪、海尔等企业均作为第一完成单位摘得奖项。
其中,科大讯飞牵头的“多语种智能语音关键技术及产业化”项目摘获国家科学技术进步奖一等奖。科大讯飞也成为19项国家科学技术进步奖特等奖、一等奖中唯一作为牵头单位获奖的民营企业。
这也令整个中国人工智能领域侧目。“科大讯飞获奖是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域首个国家科学技术进步奖一等奖。”一位人工智能业内人士称。
此次科大讯飞所获国家科学技术进步奖一等奖隶属于“计算机与自动控制组”,该组别一直竞争激烈。2020年评选中,该组别“一等奖空缺”。
2024年2月7日,国家科学技术奖励工作办公室发布《国家科学技术奖励工作办公室公告第98号》,公告显示形式审查合格予以受理的科技进步奖通用项目709项。其中,信息领域相关的科技进步奖参选者有86项,包括华为陈海波牵头的“鸿蒙智能终端提作系统基座与产业应用”、百度王海峰牵头的“产业级深度学习开源开放平台”、曙光历军牵头的“国产先进计算系统关键技术及应用”等。这其中属于计算机与自动控制组的共有45项。
2024年4月8日,科学技术部再发布《国家科学技术奖励工作办公室公告第100号》,初评共通过国家科学技术进步奖通用项目132项。计算机与自动控制组中,初评建议等级为一等奖的仅剩2项。
最终,2023年度国家科学技术进步奖评出特等奖3项,一等奖16项。科大讯飞牵头的“多语种智能语音关键技术及产业化项目”成功拿下奖项。
值得注意的是,该组别上一个获得一等奖的人工智能项目可能还要追溯到2001年,由北京汉王科技有限公司主导的“汉王形变连笔的手写识别方法与系统”。
“国家科学技术进步奖是大陆科学技术领域的最高奖项,对企业来说,获得这一奖项不仅是对其研发实力和技术水平的权威认可,还能推动背后产业的技术进步和创新。”一位资深投资人说。
坚持国家战略导向
在本次奖励大会召开的一个月前,《国家科技奖励条例》迎来自1999年颁布以来的第4次修改。
修改后的条例,突出强调了党中央对国家科技奖励工作的集中统一领导,并在“国家科学技术奖应当与国家重大战略需要和中长期科技发展规划紧密结合”前,补充了一句“应当坚持国家战略导向”。
2017年,国务院印发《新一代人工智能发展规划》(国发〔2017〕35号)(以下简称《规划》),确立了“三步走”目标:到2020年人工智能总体技术和应用与世界先进水平同步;到2025年人工智能基础理论实现重大突破、部分技术与应用达到世界领先水平;到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。
“多语种智能语音关键技术及产业化,在一定程度上完成了《规划》中提出的‘技术与应用部分达到世界领先水平’的目标。”科大讯飞研究院副院长高建清表示。
高建清称,该项目包含多语种语音识别、多语种语音合成、多语种翻译技术等为一体的综合技术,除了支持6个联合国通用语种,还包括挪威语、丹麦语等小语种63个。同时,该项目还覆盖了维、藏、蒙、哈、朝、壮、彝等24种少数民族语言和中国方言,未来还将覆盖更多方言。
“持续攻关多年,科大讯飞攻克了多个技术难题。”高建清表示。其中,最大的创新点是“复杂语音信号解耦建模”“多语种共享建模”“语音语义联合建模”和“国产异构硬件平台训练及推理”。
另一方面,多语种技术也是中国企业加速出海的必备“利器”。
科大讯飞的“多语种智能语音关键技术及产业化”在华为手机的出海中发挥重要作用,近两年则在中国新能源汽车出海的浩荡进程中成为技术优势。
2023年,中国成为汽车出海第一大国。中国汽车出海10强企业中有8强和科大讯飞合作,已覆盖23个语种,出口60余个国家。讯飞的车载智能化产品已累计前装超5300万套,支持奇瑞、一汽、长安等车企超200万套订单出海。
凭借自主可控的多语种产业生态,科大讯飞的多语种智能语音技术不仅开创引领中国语音产业快速发展,更支撑中国智能制造产业不断升级,提升出海优势,并助力打破全球语言障碍。
抢入大模型时代
事实上,科大讯飞在25年的历史中共获得3次国家科学技术奖。前面两次分别是:“KD系列汉语文语转换系统”获2002年度国家科技进步二等奖;“智能语音交互关键技术及应用开发平台”获得2011年度国家科技进步二等奖。
2002年获奖是源于汉语语音合成技术的关键突破。中文文本实时转换成汉语普通话语音输出,合成的语音自然流畅,整体技术达到了国际领先水平;产品已应用于中国电信语音互联网、中国移动语音门户、电力、金融呼叫中心、手机、车载GPS、军工等众多领域,取得重大经济效益和社会效益。
2011年获奖则是因为讯飞语音合成、语音识别、语音评测以及语音工程等应用方向开展了一系列创新研究,多项核心关键技术取得突破并达到国际领先水平,并研发和完善了应用开发平台。相关产品在电信、金融、教育、交通、政府等社会各行业普及应用,并助力奥运、世博等重大工程。
“前两次获奖,代表着我们的技术突破都有效防范了发达国家和跨国公司对大陆语音产业的垄断风险,推动了大陆民族语音产业的整体发展,保障了大陆在智能语音交互技术与产业中的主导权。”科大讯飞董事长刘庆峰表示。
从2022年底开始,人工智能热潮席卷全球,以ChatGPT为代表的大模型发展如火如荼。大模型展现出的强大通用人工智能能力,已成为人工智能发展中里程碑式的进展,被认为将重塑人类社会的生产生活方式。
科大讯飞在两度拿下二等奖后,一举斩获人工智能领域国家科学技术进步一等奖,也释放出明显的信号。
“科大讯飞多语种智能语音关键技术中的创新和大模型技术相互补充、相互促进。”科大讯飞相关人士表示。
数日前,科大讯飞刚在北京发布讯飞星火大模型4.0及相关落地应用。在国内外12项大模型主流测试集中,讯飞星火大模型4.0在8个测试集中排名第一,超越GPT-4 Turbo等国际大模型。
大模型技术可以在复杂语义理解、长文本建模能力上进一步提升语音识别、合成和翻译的效果,同时基于其强大的语义理解、知识问答、多轮对话、多模态建模能力,也能进一步大幅提升智能语音技术的使用场景和应用价值,支撑实现语音同传、自动客服、辅学答疑、家庭医生、虚拟员工、陪伴机器人、服务机器人等等未来智能产品创新,加速通用人工智能时代的到来。
刘庆峰称,应由国家级权威机构和行业龙头企业联合,共同发布具有公信力的大模型评测标准和应用指南,并定期组织系统全面的科学评测,指导各行业甄别和选用大模型。“我建议首批可以加快开发面向金融、工业、汽车、文旅、政务、教育、医疗等关键行业和领域的应用场景,加快打造标杆示范,在验证成效后向全国规模化推广。”
来源:新华社