天天看点

深度解读:中vs美 AIGC生态格局对比

作者:ChatGPT扫地僧

当硅谷的投资者和创始人对生成式人工智能产生兴奋时,同样的生成式人工智能热潮也席卷了中国的投资者和创始人。关于ChatGPT、DALLE-2和Stable Diffusion的消息几乎同时传遍了西方科技界,也迅速传到了北京。

但在西方鲜为人知的是,中国正在建立自己的生成式人工智能平行宇宙。中国的科技巨头正在构建与OpenAI的ChatGPT和DeepMind的AlphaFold相同的模型,而中国的初创企业界也对这一新技术所带来的巨大机遇有所察觉。

尽管美国的科技人士通常对硅谷以外的事物视而不见,但政治评论家迅速宣称中国在实施人工智能方面“超过了美国”,并且美中之间将出现新兴的“生成式人工智能竞赛”。

那么,中国的生成式人工智能格局究竟发生了什么?它对世界其他地区有何意义?

生成式人工智能的炒作和焦虑ChatGPT发布仅一周后,中国的科技界就充斥着关于这个新聊天机器人的新闻。科学家们开始讨论人工智能何时能通过图灵测试,科技界开始思考ChatGPT是否能挑战谷歌,而投资者则对生成式人工智能成为下一个价值数万亿美元的商业领域充满期待。

半年前,在2022年度百度世界论坛上,百度的创始人兼CEO李彦宏提出了一个新的市场概念:“AI生成内容”(AIGC)。他在主题演讲中强调,在未来十年,“AIGC将颠覆当前所有的内容生产模式”。他相信AIGC有潜力将原始内容生产成本降低到当前的十分之一,并将生产速度提高数百倍甚至数千倍。

然而,西方实验室发布强大的人工智能模型也引发了中国科技界的警钟。针对OpenAI发布ChatGPT的情况,中国的观察家表达了对中国被西方科技进步“甩在后头”的担忧。这些API由少数西方公司控制,更加加剧了中国新兴初创企业的焦虑感。

中国的人工智能模型尽管ChatGPT和Stable Diffusion风靡全球,中国实验室发布的生成式人工智能模型却受到了较少的关注。然而,中国的科技巨头和该国最杰出的人工智能科学家正在不知疲倦地努力构建相同的模型。事实上,中国似乎是除了美英垄断之外唯一一个开发自己模型基础设施的国家。

除了谷歌、OpenAI和Meta等生成式人工智能领域的知名参与者外,按模型数量计算,排名前十的开发者中有四家位于中国[1]。其中包括百度、阿里巴巴等科技巨头,清华等顶尖大学,以及北京人工智能研究院等政府支持的实验室。

虽然总部位于以色列的AI21实验室和加拿大初创公司Cohere也在构建大规模模型,但中国是除了美英之外,唯一具有多个实验室构建和发布这些模型的国家。中国还建立了自己的人工智能框架,包括华为的MindSpore和百度的PaddlePaddle。这些框架与主流的西方框架(如PyTorch和TensorFlow)不兼容,但有一些转换工具,如Ivy,可以在这些框架之间进行桥接。

除了模型训练基础设施外,中国的开发者在硬件层面也越来越独立。为应对美国制裁的威胁,中国公司越来越多地转向国产GPU,如华为的Ascend 910,这有助于训练像PanGu-α和ERNIE 3.0 Titan这样的生成式人工智能模型。这些努力为发展一个繁荣的生成式人工智能生态系统奠定了基础。

深度解读:中vs美 AIGC生态格局对比

就模型参数数量而言,这是模型性能的一个大致指标,中国模型大约落后于西方顶尖模型一年左右。与“中国的AI更大、更强、更快”的说法相反,中国在模型规模和性能方面落后于西方。而且,中国很难在短期内超越美国,这主要是因为在顶级人工智能人才方面存在差距。中国实验室非常擅长借鉴领先的西方实验室的进展,但在提出原创模型和推动研究边界方面的能力较弱。因此,中国在生成式人工智能模型领域很可能在相当长的一段时间内保持亚军地位。

深度解读:中vs美 AIGC生态格局对比

西方开源模型的发布也使得中国开发者能够避免昂贵的开发成本,并快速将现有模型适应中文。在Stable Diffusion发布几个月后,中国的研究团队IDEA-CCNL迅速训练并发布了Stable Diffusion的中文版本(名为太乙-Stable Diffusion)。该模型在捕捉中文文化背景方面表现得更好。

深度解读:中vs美 AIGC生态格局对比

太乙-Stable Diffusion生成的艺术作品:“铁马冰河入梦来,立体画”(出自宋代诗人陆游之诗)。

深度解读:中vs美 AIGC生态格局对比

"飞流直下三千尺,油画"(出自唐代诗人李白之诗)。

中国的生成式人工智能市场图谱

在应用层面上,中国也落后于硅谷的初创企业生态系统。这再次挑战了中国人工智能实施领先于美国的说法。如果将我们的中国市场图谱与之前的硅谷市场图谱进行比较,你会发现中国还有许多垂直领域尚未开发。例如,在中国,很少有生成式人工智能公司专注于开发者工具和提供编码辅助。这可能是一个完全被西方公司主导的领域,因为在开发者工具市场上存在较少的文化、语言和政策障碍。

深度解读:中vs美 AIGC生态格局对比

即使在现有的垂直领域中,中国的参与者数量也较西方少。中国的文本生成、图像生成和音频生成初创公司的市场景象需要时间才能成熟到西方的水平,并且可能难以找到足够大的市场。这是因为大部分西方的文本生成和图像生成初创公司是面向企业的公司,而中国的B2B市场规模要小得多。

这意味着中国的生成式人工智能领域更像是一个较少竞争对手、市场动态快速发展、甚至更多创业公司和投资者机会的蓝海。难怪中国的科技巨头和顶级风险基金都在密切关注中国的生成式人工智能领域。

然而,中国的企业市场发展程度远不及美国,企业不愿意为软件付费,更习惯于支付服务费用。我们可能会看到中国的人工智能公司创建一种本质上是“服务前端,人工智能软件后端”的商业模式。这些公司的行为可能与传统的SaaS公司有很大不同。

深度解读:中vs美 AIGC生态格局对比

与美国拥有健全的水平化SaaS市场不同,中国的人工智能驱动公司更有优势深耕细作,为少数几个大型行业提供服务,而不是广泛针对SaaS市场。在一些领域,中国领先于美国,包括电子商务、短视频制作,也可能包括游戏。事实上,我们已经看到中国的生成式人工智能公司进入了这些领域。比如,AI视频生成平台Fancy Technology专门面向电子商务企业。

由于文化障碍和政策限制,西方科技初创公司越来越不愿进入中国市场。在中国可能会有一个平行的生成式人工智能领域,国内企业相互竞争,并相对独立于硅谷的对手。

相同的技术,不同的垂直领域然而,类似其他领域,简单的“复制到中国”的模式通常行不通。在西方,基于文本的人工智能写作和营销工具是最受欢迎的生成式人工智能公司类型,但在中国这类工具较为罕见。中国企业更小的销售和营销预算给商业化带来了挑战。高质量的中文语言训练数据的稀缺成为高性能语言模型发展的瓶颈。视频营销的广泛使用也意味着基于文本内容的应用案例较为狭窄。

相反,中国正在发展自己的生成式人工智能应用垂直领域。就以基于文本内容创作工具为例,许多产品不是专注于销售和营销,而是提供通用的学术写作支持和翻译服务。受欢迎的AI写作工具Pitaya专注于提供学术写作辅助和英文翻译服务。这是因为中国庞大的学生群体在英语和学术写作方面经常遇到困难,中国面向全球的公司要求员工与外国同行用英语交流。

此外,一些基于文本的中国产品专注于特定用例,甚至更为狭窄的垂直领域。另一家领先的自然语言处理(NLP)初创公司LangBoat专注于金融文本分析。它能够帮助中国的金融机构从成千上万页的会议记录、合同和市场报告中快速提取关键数据点。尽管中国的通用型人工智能模型仍然略逊于世界领先的模型,但构建具有大量领域数据的垂直专用模型通常弥补了性能差距,并且通常能产生更好的实际应用结果。

在中国,生成式人工智能领域中发展特别迅速的一个领域是AI视频生成,尤其是数字人和电子商务视频营销。与西方的AI头像和数字人初创公司倾向于强调性能不同,中国公司更加注重其头像的娱乐价值。只需将伦敦的AI视频初创公司Synthesia创建的AI头像与中国小冰生成的AI员工崔小盼进行比较。Synthesia的头像看起来像普通的商业人士,而小冰的头像崔小盼看起来像是一位K-pop偶像。

深度解读:中vs美 AIGC生态格局对比
深度解读:中vs美 AIGC生态格局对比

小冰创造的AI员工崔小盼在2021年被房地产公司万科评选为“年度最佳新员工”。

数字人和AI头像在中国的媒体、娱乐和电子商务领域也被广泛应用。一个原因是这些AI头像具有更高的娱乐价值——它们外观更出色,并且它们的创作者对媒体和娱乐有更好的理解。因此,消费者更愿意接受AI作为浪漫伴侣、电视主持人和TikTok营销人员的角色。

深度解读:中vs美 AIGC生态格局对比

中国滑雪选手谷爱凌的AI头像由数字媒体公司咪咕创建。

另一个原因是中国的电子商务领域更加注重视频而不是文本或图像。中国拥有一个庞大的视频营销行业,在这个行业中,企业通过直播和短视频来销售产品。(请记住,中国是非常受欢迎的短视频应用TikTok的诞生地)。如果中国的一些AI视频创业公司能够突破并在全球范围内成为主导者,那将不足为奇。

然而,中国的生成式AI创业公司面临着与西方同行相同的挑战,包括找寻适用场景的问题以及长期商业化和盈利问题。例如,中国已经有很多AI图像生成应用程序,但很少有建立可行商业模式的。大多数应用程序更像是玩具,而不是有用的工具,一旦客户熟悉了这项技术,很可能就会失去他们的注意力。商业化问题在中国投资者对生成式AI未来前景的讨论中经常被提及。

中国创业公司的全球野心谈论硅谷创业公司的全球市场计划是很正常的。但是一提到中国公司的海外扩张往往会引发西方观察家的警惕。然而,对于中国创业公司来说,海外扩张(或称为“出海”)是一个自然而然的步骤。随着中国科技行业的发展,越来越多的公司将从一开始就具备全球视野。

这些中国创业公司中的许多进入的是西方公司未涉足的市场。AI语音助手创业公司AI Rudder主要面向东南亚市场,并提供近20种不同的语言和当地方言的产品。公司最初在上海成立,随后在新加坡设立了办事处,为东南亚市场提供服务。

AI时尚创业公司ZMO.ai也是在中国成立,并获得了来自顶级中国风险投资基金(如高瓴资本和GGV Ventures)的资金支持。该公司随后在美国和加拿大设立了办事处,并进入北美市场。该公司为全球时尚品牌创建AI模型。

深度解读:中vs美 AIGC生态格局对比

ZMO.ai生成的AI模型图像

一方面,中国的生成式人工智能公司希望拓展全球市场,这是因为在中国进行B2B业务存在挑战。这在很大程度上是因为中国企业不太愿意为软件付费,因为在中国,人力成本仍然较低。另一方面,具有中国背景的创始人可能会希望保留他们在中国的工程团队,以利用中国丰富且具有成本效益的工程人才,就像Zoom和字节跳动所做的一样。

监管措施即将出台中国政府在监管生成式人工智能方面比其西方对手领先一步。2022年11月,中国国家互联网信息办公室发布了《关于规范互联网信息服务中深度合成内容的规定》,这是一套用于监管合成内容的政策,包括人工智能生成的文本、图像和视频。这些规定已于2023年1月生效,其中包括风险评估、实名用户注册和标记人工智能生成内容等要求。

然而,随着生成式人工智能产品越来越受欢迎,其他伦理和政策问题可能会出现。目前,人工智能生成的内容处于法律灰色地带,版权和知识产权归属仍不清楚。正如OpenAI的代码生成模型Codex面临一位GitHub开发者提起的侵权诉讼,西方和中国的人工智能公司对知识产权的问题变得更加谨慎。中国的人工智能艺术生成初创公司TIAMAT确保其模型训练所使用的数据没有知识产权。这一措施也被美国知名艺术生成应用程序Midjourney采用。

那么美国的制裁呢?对中国的生成式人工智能领域进行分析时,必须考虑到美国加强制裁的影响。2022年9月,美国政府禁止芯片制造商Nvidia和AMD向中国销售其最先进的图形处理器(GPU)。许多西方观察家认为,这一举动可能严重阻碍中国大规模生成式人工智能模型的发展,这些模型通常需要大量计算资源进行训练。

然而,此类制裁对应用层初创公司的影响相对有限,因为很少有公司使用先进的GPU来训练和部署他们的人工智能模型。即使是百度等中国科技巨头的人工智能云业务也受到的影响较小,它们在业务中很少使用受到制裁的GPU,并且从长远来看,它们的目标是开发自己的GPU来取代进口产品。Nvidia也已经为中国市场专门推出了符合规定的GPU,以避免制裁影响。

将受到影响的是中国的基础研究机构,它们依赖先进的GPU来训练和扩展他们的模型。事实上,绝大多数中国的大规模生成式AI模型都是在Nvidia的GPU上进行训练的,包括大部分百度开放AI联盟(BAAI)的无道1.0和无道2.0模型,清华大学的多模态CogView模型,以及百度的大规模语言模型ERNIE 3.0。

最近,拜登政府正在考虑对美国对华出境投资进行新的限制措施。这些限制的影响将取决于其范围和条件。早在美国政府开始考虑投资控制之前,北京已经对美元基金的投资活动实施了限制。尽管这些基金大多设在中国,但由于它们的资本来源是外国的,它们在中国的深科技领域几乎被排除在外。美国对对外投资的额外限制将进一步加强美国和中国科技生态系统之间的障碍。

总结思考中国的生成式AI领域正在快速发展,除了硅谷的生成式AI领域外,可能是最令人感兴趣的。中国是唯一一个除了美国和英国之外拥有完整的“生成式AI堆栈”的国家,从基础模型到应用都有涉猎。由于中国市场在许多方面与西方不同,因此中国的生成式AI领域与西方有很大的差异。与此同时,中国的创业者和投资者在生成式AI方面面临着与西方同行相同的挑战,即创建可持续的商业模式和将先进技术商业化。中国开发者还面临着美国制裁和国内政策限制的额外挑战。

我们仍认为中国处于生成式AI生态系统兴起的早期阶段。也许与移动时代类似,两个生态系统中标志性的未来以AI为先的公司将看起来截然不同。在美国,这些公司可能会为传统企业使用案例提供服务,得益于该国成熟的B2B软件市场,而在中国,一个拥有庞大电商、供应链和消费者行业的国家,我们预计会看到创业者建立竞争力强的以AI为先的公司来服务这些市场作为起点。

即使考虑到在基础研究能力方面的技术滞后以及美中紧张关系不断增加的压力,我们预计中国的市场和人才将继续为中国社会以及其他地区创造令人兴奋的公司。