天天看点

专访那个与英伟达叫板的女人:AI芯片没有护城河 选择开放至关重要

专访那个与英伟达叫板的女人:AI芯片没有护城河 选择开放至关重要

划重点:

--AMD CEO苏姿丰称除GPU之外,当前全球芯片市场整体供求平衡。

--《芯片和科学法案》利好美国半导体行业,但取得实效仍需多年时间。

--AMD正在开发AI芯片MI300,训练工作负载能够比肩英伟达H100。

--人工智能芯片开发没有护城河,选择开放、特别是开放软件尤为重要。

专访那个与英伟达叫板的女人:AI芯片没有护城河 选择开放至关重要

AMD首席执行官苏姿丰 ( Lisa Su )日前在The Code Conference大会上与美国知名科技媒体人尼莱·帕特尔(Nilay Patel)进行了一场深度对话。双方讨论了许多话题,尤其是关于人工智能和芯片供应链的问题。

过去几年,由于新冠肺炎疫情加剧了全球芯片短缺;如今,由于大型科技企业都想运行人工智能模型,导致需求突然再次激增。

苏姿丰表示,目前供需平衡总体上处于一个相当好的状态,只有支持大型人工智能模型的高端GPU是个例外。苏姿丰还谈到,美国要实现芯片的自给自足仍有很长的路要走。以下为访谈内容摘要:

问:我有许多问题需要问你。让我们从一些令人兴奋的事情开始。AMD今天在AI市场制造了一些新闻。这是怎么回事?

苏姿丰:首先,今年Code Conference大会的主题是人工智能,这也是这些天来科技产业的主题。当我们看到计算真正推动人工智能发展的所有机遇时,这正是我们努力的方向。所以,今天早上,我们确实收到了一家名为Lamini的初创公司的公告。我们一直在同这家伟大的公司合作,它拥有一些大型语言模型的顶尖研究人员。

当我与各个公司的首席执行官交谈时,所有的人都会问:“我知道我需要关注人工智能。我知道我需要做点什么。但我该怎么办呢?这太复杂了,有很多不同的因素。”借助像Llama这样的基础模型,许多企业实际上希望使用自己的数据定制化这些模型,确保可以在私有环境中让应用程序做到这一点。Lamini从事的就是这项工作。Lamini实际上为企业定制模型、微调模型,这家公司采用的是AMD的GPU。所以这是一件很酷的事情。我们花了很多时间和这家公司合作,真正优化软件和应用程序,以便尽可能轻松地开发为企业微调的模型。

问:我想深入讨论一下软件问题。我认为把不同层次的软件开发从硬件中抽象出来是非常有趣的。但让我们回到主题。在芯片市场,我们正在结束每个工艺节点的芯片都受到相当令人难以置信的限制的时期。你认为我们目前的处境如何?

苏姿丰:这个话题非常有趣。我想我在半导体行业从业已有至少30年时间。在很长的一段时间里,人们甚至不了解半导体是什么,它们在整个供应链中的位置,以及它们是应用程序所必须的。我认为过去几年,特别是随着大流行驱动的需求以及我们在人工智能方面所做的一切,人们现在真正开始关注半导体。

我认为这是一个巨大的循环。首先是我们需要的芯片比供应多得多的周期,其次是生产的芯片过多的周期。但归根结底,我认为事实是半导体对于许多应用程序而言都是必不可少的。尤其是对我们来说,我们关注的是最复杂、最高性能、最前沿的半导体。我要说的是,这个市场将会大幅增长。

问:你觉得现在的瓶颈是什么?是最尖端的吗?还是我们在芯片短缺期间听到的在较旧的工艺节点上的问题?

苏姿丰:我认为,整个行业已形成了一个生态系统,为确保满足总体需求投入了大量资源。所以总的来说,我会说除了GPU之外供需平衡非常好。如果需要GPU来进行大型语言模型训练和推理,它们目前的供应可能稍微有点紧张。

但事实是,我们绝对在付出巨大的努力,让整个供应链加速发展。这些是世界上最复杂的设备--数千亿个晶体管,大量先进技术。但总体供应绝对在增加。

问:去年通过的《芯片和科学法案》对美国的半导体厂进行了大量投资。AMD显然是全球最大的无厂半导体公司。《芯片和科学法案》是否已经产生了明显的效果,或者我们仍需要等待它结出果实?

苏姿丰:我确实认为,如果看看《芯片和科学法案》,以及它为美国半导体行业所做的一切,它真的是了不起。不得不说,我向吉娜·雷蒙多(Gina Raimondo,美国商务部部长)以及美国商务部与工业界所做的一切致敬。这些都是需要很长时间的事情。美国的半导体生态系统五年前就需要建立。它现在正在扩张,尤其是在前沿领域,但这需要一些时间。

所以说,我目前还不知道我们是否感受到了影响。但我们一直相信,长期投资越多,影响就会出现。所以我对美国本土的产能感到兴奋。我也对我们国家研究基础设施的一些投资感到非常兴奋,因为这对长期的半导体实力和领导地位也极其重要。

问:AMD的财务数据就能够证明这一点。AMD目前卖出的芯片比几年前多得多。你在哪里找到的供应?当等待新的半导体工厂出现时,AMD是否还在依赖台积电?

苏姿丰:当看看我们所处的业务时,就会发现它正在推动技术的前沿。因此,我们始终处于最先进的节点上,并努力实现下一个重大创新。这是工艺技术、制造、设计和设计系统的结合。我们对与台积电的合作感到非常高兴。台积电是世界上最优秀的企业,拥有先进和领先的技术。

问:AMD能否摆脱台积电?

苏姿丰:我认为关键是地缘的多样性。当你考虑到地缘多样性时,无论发生什么,这都是真的。没有企业希望固守成规,因为风险会随之出现。这就是《芯片与科学法案》实际上有所帮助的地方,因为现在美国正在建造大量的半导体制造厂。它们实际上将在未来几个季度开始投产,我们将积极在美国进行部分制造。

问:当英特尔首席执行官帕特·基辛格(Pat Gelsinger)参加俄亥俄州工厂奠基仪式时,我与他进行了交谈。英特正试图成为一家半导体代工厂。他非常自信地对我说:“我希望在其中一个半导体工厂的侧面有AMD的标志。” 他离实现这一目标还有多远?

苏姿丰:我想说,从美国国内制造业来看,我们确实正在寻找很多很多的机会。我认为英特尔首席执行官有一个非常雄心勃勃的计划,而且我认为这就是目标。我认为我们总是关注谁是最好的制造合作伙伴,对我们而且最重要的是真正致力于前沿技术的企业。

问:在这方面,市场上有没有台积电的竞争对手?

苏姿丰:市场上总是有竞争的。台积电当然非常不错。三星电子当然也在进行大量投资。你提到了英特尔。我想日本也在来培养先进的制造业。所以有很多不同的选择。

问:你提到GPU目前供不应求。就拿Nvidia H100来说,实际上存在获取这些芯片的黑市。AMD有GPU,而且正准备推出新款GPU。你刚才还提到,Lamini的训练完全在AMD的GPU上进行。因为英伟达的GPU供应有限,AMD是否看到了扰乱市场的机会?

苏姿丰:我想退后一步,谈谈人工智能市场正在发生的令人难以置信的事情。如果你想想我们在过去十年或二十年看到的技术趋势--无论谈论的是互联网、手机革命还是PC如何改变事物--就人工智能对我们所做的一切的影响而言,它是它们的十倍、百倍不止。

因此,从生产力的角度来看,无论是企业、个人或社会生产力,人工智能的影响都将会是巨大的。因此,GPU短缺的事实,我认为并不奇怪,因为人们已经认识到这项技术的重要性。现在,我们正处于人工智能,特别是生成式人工智能如何进入市场的初期,我认为我们正在谈论的是十年周期问题,而不是在接下来的两到四个季度中你可以获得多少颗GPU。

AMD对自己的路线图感到兴奋。我认为,对于高性能计算,我将生成式人工智能称为高性能计算的杀手级应用。你需要的越来越多。尽管今天的大型语言模型已经很好,但如果继续提高训练性能和推理性能,它仍然可以变得更好。

这就是我们所做的。我们制造了最复杂的芯片。我们确实还将会推出一款新产品。如果你想知道它的代号,就叫它MI300,它会非常棒。它的目标是大型语言模型训练以及大型语言模型推理。我们看到机会了吗?是的。我们看到了巨大的机遇,而且不仅仅是一个。云计算服务提供商是唯一用户的想法是不正确的。将会有很多企业人工智能。许多初创公司在人工智能方面也获得了巨额风险投资支持。因此,我们在所有这些领域都看到了机遇。

问:新产品的名字是MI300吗?

苏姿丰:是的。

问:在性能方面,它会与英伟达H100相当,还是超过H100?

苏姿丰:就训练工作负载而言,它当然会具有竞争力,而且在人工智能市场中,也没有一体适用的芯片产品。有些芯片在训练中表现出色,有些在推理上表现出现,这取决于你如何将它们组合在一起。

我们通过MI300所做的是构建了一款出色的推理产品,特别是针对大型语言模型推理。因此,我们现在所做的大部分工作是公司训练和决定它们的模型将是什么。但展望未来,我们实际上认为推理的市场规模会更大,这与我们设计MI300初衷不谋而合。

问:如果看看华尔街认为英伟达的模式是什么,那就是CUDA、专有软件堆栈、与开发者的长期关系。AMD的ROCm模式略有不同。你认为这是一条可以通过更好的产品或更开放的方法来攻克的护城河吗?AMD将会如何攻击?

苏姿丰:当市场发展如此之快时,我不相信有护城河的存在。当你想到护城河时,它是更成熟的市场,人们并不真正想要改变很多事情。当你观察生成式人工智能时,你会发现它正在以令人难以置信的速度发展。我们目前在常规开发环境中几个月内取得的进展,过去可能需要几年时间。尤其是软件,我们选择的是开放软件。

实际上存在二分法。如果看看过去五年、七年或八年开发软件的人,他们倾向于使用……让我们称之为更特定于硬件的软件。它非常方便。但当时没有太多选择,智能选择这个。当展望未来时,实际上会发现每个人都在寻求构建与硬件无关的软件的能力,因为人们想要选择。坦率地说,人们想要选择。人们希望使用旧的基础设施。人们希望确保他们能够从一种基础设施迁移到另一种基础设施。因此,他们正在构建这些更高级别的软件。例如,类似开源的Python机器学习库PyTorch这样,往往具有与硬件无关的功能。

我确实认为未来十年将与过去十年不同,因为这关系到你如何在人工智能中发展。我认为我们在整个行业和生态系统中都看到了这一点。开放式方法的好处是没有一家公司拥有所有的理念。因此,我们越是能够将生态系统整合在一起,就越能利用所有希望加速人工智能学习的非常睿智的开发人员。

问:PyTorch未来的发展极其巨大,对吗?这是所有这些模型实际编码所用的语言。我与一些云供应商的首席执行官交谈过,他们都不喜欢依赖于英伟达,就像任何人不喜欢依赖任何一家商家一样。你可以与这些云供应商合作,并说“我们将针对PyTorch而不是CUDA优化我们的芯片,”然后开发人员可以在PyTorch上运行并选择最佳优化的吗?

苏姿丰:确实如此。如果想想PyTorch正努力做什么--它确实在努力成为那种与硬件无关的层。我们在PyTorch 2.0上实现了一个主要里程碑,AMD在第一天就获得了资格。这意味着现在在PyTorch上运行CUDA的任何人,都可以开箱即用地在AMD上运行。坦率地说,它也可以在其他硬件上运行。

但我们的目标是“让最好的芯片获胜”。这样做的方法是让软件更加无缝。它可以是PyTorch,可以是Jax,也可以是OpenAI在Triton中引入的一些工具。有很多人也在做“构建自己的”类型的事情。所以我确实认为这是人工智能软件的未来浪潮。

问:AMD是否在为上述公司开发定制化的芯片?

苏姿丰:我们有能力开发定制化芯片。我认为开发定制芯片的时机实际上是当得到大量应用的时候。所以我相信在接下来的几年里会有定制芯片出现。另一件有趣的事情是,你需要各种不同类型的人工智能引擎。因此,我们花了许多时间讨论大型GPU,因为这是处理大型语言模型所需要的。但你也会看到一些ASIC芯片。你还将在客户端芯片中看到人工智能。因此,我对人工智能将如何广泛地融入所有细分市场的芯片感到非常兴奋。

问:我们谈论的是在很大程度上提高成本曲线的事情:许多聪明人在尖端流程节点上做了大量工作来开发真正高端的GPU。一切都变得越来越贵,你可以看到消费者的应用程序是多么昂贵:每月25美元,微软Office 365 Copilot的定价为每用户每月30美元。你什么时候才能得到降低消费者价格的成本曲线?

苏姿丰:这是一个非常好的问题。我相信,人工智能在生产力方面的价值绝对会得到证明。诚然,目前这些基础设施的成本很高,但另一方面用户得到的生产力提升也令人兴奋。我们正在AMD内部部署人工智能,这是一个高度优先事项,因为如果我们能更快地设计出芯片,它就能带来巨大的生产力。

问:你信任人工智能吗?你会让员工检查人工智能正在做的工作吗,或者是完全信赖它?

苏姿丰:我们都在尝试,对吧?我们正处于构建工具和基础设施,以便进行部署的早期阶段。但事实是人工智能节省了我们的时间--无论我们是在设计芯片、测试芯片还是验证芯片--它节省了我们的时间。在我们的世界里,时间就是金钱。

但回到你的问题,什么时候能够降低成本曲线。我认为这就是为什么需要广泛思考人工智能,而不仅仅是在云端如此重要。如果想想几年后生态系统会是什么样子,你会想到由云基础设施来训练这些最大的基础模型,但你也会有一些边缘人工智能。无论是在电脑里还是在手机里,都可以进行本地人工智能。本地人工智能服务更便宜、更快,而且当你这样做的时候,实际上更私密。因此,这就是人工智能无处不在的理念,以及它如何真正增强我们当前的部署方式。

问:我们应当如何监管人工智能?

苏姿丰:我认为这是我们大家都非常认真对待的事情。从生产力和发现的角度来看,这项技术有很大的优势,但人工智能也有安全性的问题。我确实认为,作为大公司,我们有责任。如果考虑围绕数据隐私的两件事,以及在开发这些模型时确保它们在没有太多偏见的情况下尽我们所能进行开发。我们会犯错误的。整个行业在这里不会是完美的。但我认为,人工智能的重要性是明确的,我们需要共同努力,需要建立公共/私有伙伴关系来实现这一目标。

问:如果接受监管,芯片是否会受到限制?

苏姿丰:是的,我会接受一个机会,让我们看看需要采取哪些保障措施。

问:我认为这将是最复杂的一次……我不认为我们期望芯片在我们能做的事情上受到限制,感觉这是一个我们必须要问和回答的问题。

苏姿丰:我再说一遍,不是芯片本身的问题。因为一般来说,芯片具有广泛的功能。这个问题与芯片加上软件和模型有关。特别是在模型方面,你在安全措施方面做了什么。

问:AMD的芯片已经出现在PS5和Xbox当中。有一种观点认为,云游戏是所有事物的未来。这对AMD来说可能很好,因为AMD也会在它们的数据中心。但你看到这种转变正在发生吗?这是真的吗,还是我们仍在游戏主机时代?

苏姿丰:游戏无处不在。人们一直在谈论:这是主机游戏的终结吗?我看不出来。我认为PC游戏很强大,我认为主机游戏很强大。我认为云游戏也很强大。它们都需要类似类型的技术,但它们显然以不同的方式使用它。(无忌)