整体对标GPT-4 Turbo 科大讯飞刘庆峰称应理性认识大模型综合差距

本报记者陈佳岚广州报道

OpenAI最新大模型版本GPT-4o发布一个月，国内厂商科大讯飞就声称旗下大模型已在多方面能力对标GPT-4o了。

6月27日，科大讯飞发布基于全国首个万卡算力集群“飞星一号”的星火大模型V4.0版本，该版本七大核心能力全面升级，其声称在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对GPT-4 Turbo的整体超越。

“讯飞星火大模型V4.0是在全国产算力平台上训练的大模型，所有算法都是我们自主可控的，每一行码、每一个数据都是我们自己编写、自己清洗出来的大模型。”科大讯飞董事长刘庆峰表示，一定程度上，星火大模型V4.0的发布对完全自主可控的大模型究竟走到了什么样的发展阶段，具有重要的标志意义。

“我们多语言的语音识别原来需要1万小时数据，现在只要100小时数据就能做到比原来1万小时还好的效果。”刘庆峰表示，在中国，一定要考虑用更小的算力、更小的数据，做出更优质的落地成果，这样才能够真正地在未来几年打赢这一场人工智能红利赋能产业的“仗”，但同时，整个社会还要加强源头技术创新的氛围，一定要看到中美之间的差距，才能够迎头赶上，绝不能盲目自信，盲目地认为我们都已经超越了。差距还是很大的，需要大家有充分清晰而又理性的认知。

核心能力提升对标GPT-4 Turbo

ChatGPT作为领先的语言模型代表了当前人工智能领域的先进技术水平，国内大模型总喜欢与之一较高下，这不仅是国内大模型希望通过与ChatGPT竞争提高自身的市场认知度和用户基础，背后也是中美大模型差距的较量，还可以减少对外部技术的依赖。

《中国经营报》记者注意到，对于科大讯飞而言，其讯飞星火大模型版本几乎每次更迭都会与ChatGPT做对比，这次也不例外。OpenAI在上个月（5月14日）刚发布了最新大模型版本GPT-4o，聚焦语言交互功能的提升，科大讯飞就迫不及待地要和GPT-4o进行PK了。

科大讯飞官方介绍，根据《通用认知智能大模型测评体系2.0》测试结果，讯飞星火V4.0已经实现了和GPT-4 Turbo的全面对标，在文本生成、语言理解、知识问答、逻辑推理、数学这些能力上都已经实现超越。

现场，刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果，星火“智商”再度进化。“复杂指令”现在得到了很好的提升，例如对标题使用修饰手法、需要引经据典的情况以及要用成语等，它都能理解，这就是“复杂指令”的跟随能力。

然而，科大讯飞也坦言讯飞星火V4.0在代码和多模态能力上与GPT-4 Turbo还有差距。

刘庆峰表示，代码能力是我们非常关注的能力之一，因为它涉及未来的产业信息化和信息产业化的核心。ChatGPT去年2月通过谷歌二级程序员测试，当时的GPT-3.5用这个测试集只获得了60多分。GPT-4 Turbo今年1月测试大概在80分，现在到86分，也在快速迭代和进步。预计在今年8月，讯飞星火会达到86分以上的水平。

而讯飞星火V4.0多模态能力与GPT-4 Turbo还有所差距，是因为我们当前在文生视频上还没有算力，也是下一步的核心重点，但是有生态伙伴一起做。

认识中美科技综合差距、长期主义打造自主可控生态

“今天的讯飞星火V4.0对标GPT-4 Turbo是全方位对标，但是我们同时要看到，一旦GPT-5发布，因为它的模型尺寸更大、训练时间更长、数据更多，又会把差距拉开，甚至拉到一年以上。”刘庆峰坦承，,我们一定要科学理性地认识到中美科技的综合差距。

在刘庆峰看来，中美在通用大模型底座上的差距，是半年到一年半之间的动态追赶，但不会被甩开。

他继续说道：“我们有信心快速追赶，而且是在完全国产算力自主可控算法和数据基础上来追赶，保证不出现代差，保证极限情况下，能够顶上扛上。我们既要认识到差距，又要有充分的信心，要能够科学理性地给出从源头技术到生态到产业应用落地的一整套打法，要以长期主义来打造真正自主可控的AI产业生态。”

刘庆峰认为，面对未来的人工智能新生态，要关注源头技术生态、智能体生态、应用生态、行业生态。在推动的过程中，一定要实现底座技术的完全自主可控，否则可能我们就把大楼建在别人的院子里，建在沙滩上，随时会倒塌，要真正做到软硬件一体化，才能更深度地落地。

记者注意到，刘庆峰多次强调要打造自主可控的AI产业生态的重要性。

2023年10月17日，英伟达应美国商务部要求，对中国所有能训练大模型的智能算力全面断供。近日，OpenAI在官方推送的邮件通知中明确指出，自7月9日起，将开始阻止来自非支持国家和地区的API流量包括来自中国的API申请。

在刘庆峰看来，从英伟达断供先进人工智能芯片到OpenAI阻止中国地区的API流量，都是中美科技竞争日益激烈背景下人工智能领域的博弈。在这一情况下，到底有没有自主可控的国产底座能力做支撑，决定了大陆大模型在这条路上到底能走多远。通用人工智能这波浪潮相当于PC和互联网的诞生，在人类历史上有深刻的意义，而我们能不能享受这波红利，能不能成为美国之后全球智慧涌现的第二极？刘庆峰表示：“只有自主可控的繁荣生态，才有中国通用人工智能的大未来。”

第三方咨询机构Gartner称，到2026年之前，全世界80%的企业都要用到通用AI ，今天这个数字是5%至10%。

很显然，AI是新一轮科技革命和产业变革的重要驱动力量，将对全球经济社会发展和人类文明进步产生深远影响。中国企业要想在这波浪潮中分得大蛋糕，以长期主义打造真正自主可控的AI产业生态是一条重要路径。

编辑：吴清审核：李正豪校对：刘军

整体对标GPT-4 Turbo 科大讯飞刘庆峰称应理性认识大模型综合差距

继续阅读

下一代AI大模型Grok 2，马斯克公布时间

OpenAI开发大模型内容纠错工具丨知乎推出AI搜索产品「知乎直答」

贺兰县举行2024年大型商业综合体灭火救援实战联合演练

飞利浦、未野、飞科剃须刀好用吗？行业卷王综合实测

缸瓦窑沟村党支部与省委统战部宗教综合处党支部开展主题党日活动

售20.49万！智己L6MAX标准版，纯电动后驱，综合表现如何？

呼市老年体协第六工委基层服务站老年人健身综合展演活动在黑水泉村举行

中国两大高科技巨头联手，推出人工智能大模型，超越美国GPT-4！

一个有趣的问题，你觉得#哪家数码厂商喜欢闷声干大事#？[灵光一闪]我想很多人的答案都是华为吧？无论是硬件方面还是软件系统

沙俄海军综合性能最好的“博加特里”级防护巡洋舰

高中物理 | 力学中常见的九大物理模型，学起来！

临港，古棕路城市功能综合体，设计方案出炉

一升二数学暑假作业综合卷60天每日一练（可下载打印）

迎七一庆华诞 ——西充县综合执法局召开庆祝建党103周年大会

ICML 2024 Spotlight | 在解码中重新对齐，让语言模型更少幻觉、更符合人类偏好

人类或永远被“困”在地球？科学家：宇航员会出现神经眼肌综合症