“我们意识到,大模型的发展可能是自60多年前IBM推出System/360使用GPS和深度学习加速计算以来,真正创造并重新发明了计算机。”黄仁勋表示。
近日,英伟达创始人兼首席执行官黄仁勋参加了Sana举办的人工智能峰会。会后,黄仁勋和Sana创始人Joel Hellermark展开了一场精彩对话。对话中,黄仁勋畅谈了对AI发展的想象,他还表示,未来我们了解信息、预测需求以及与供应链合作的方式都会被AI彻底改变。
黄仁勋除了谈AI未来的发展,他还分享了自己管理英伟达的方法。分享中,他反复强调赋予员工获取信息的权利非常重要,要让员工清楚地了解每一个决定的由来,有助于他们理解并执行该决定。同时他希望自己的公司规模不要太大,这样公司信息的传播能更有效率,扁平化的公司管理结构,使得他的公司能够在技术变革来临时做出快速反应,他认为这对于一家技术驱动型公司来说是非常重要的。
以下是访谈的精彩观点:
1.大模型的发展可能是自60多年前IBM推出System/360使用GPS和深度学习加速计算以来,真正创造并重新发明了计算机。
以下为对话全文(有删改):
AI改变世界
Joel Hellermark:你还记得是什么时候开始了解深度学习并对其发展产生信心的吗?
黄仁勋:我了解深度学习的时间和其他人差不多,也许稍微早一点。2012年,我们有几位研究人员同时向ImageNet提交大型图像,参加那年的大规模视觉识别挑战赛(ILSVRC)。当时我们做了两件事,一是使用最新的GPU,也就是当时刚推出的GeForce GTX 580。第二就是学习了深度神经网络编程。我们很幸运,这么早就了解接触了这些。不过那时人工智能还不是很流行,神经网络研究在当时是一个存疑的研究领域。尽管如此,我们觉得这个研究领域还是非常有希望的,所以一直坚持去研究它。
真正让我印象深刻的,是它的有效性。当你看到令人惊讶的技术时,就会产生更浓的兴趣去探究它,比如规模如何、能解决什么其他问题等。由于深度神经网络的性质,每一层的性质都是相互隔离的,并且在反向传播学习中非常有效——它会被极大地扩展,会有更大的规模。事实证明我们是对的,根据观察,深度学习既是一种解决难题的算法,也是一种开发软件的新方法。
假设你有一个任意维度的通用函数,无论问题的维度和大小如何,只要你有一个足够大的模型,你就让它学习并不断解决这个问题。这个推断对我们来说非常重要。我们对它的潜力深信不疑,这将成为开发软件的新方法。从那时起,我们意识到大模型的发展可能是自60多年前IBM推出System/360使用GPS和深度学习加速计算以来,真正创造并重新发明了计算机。这是一个非常重要的时刻,我们也很幸运地把所有的点都连接起来。
Joel Hellermark:你觉得这种模型驱动架构的发展,下一步会回到哪里?
黄仁勋:研究人员要把几乎所有问题或者每种数据都转化为Transformer可以学习的内容。你可以创建一个视觉Transformer、音频Transformer、文本Transformer等等。多模态确实非常重要,它们有更高的性能。例如,你正在训练一个视觉神经网络,但你没有见过斑马,这个时候如果再加上另一种形式的讯息,比如文字,你就会明白斑马是一匹有黑白条纹的马,马的图像和形容斑马的文字组合起来,能够让你在从来没见过斑马的情况下想象到它是什么样的。这就延长了你的感知能力。使用多模态可以增强我们的感知能力,所以过去我们会使用相机、雷达或激光雷达来延长我们对环境的感知范围。
现在我们有了Transformer,并且以一种理解多模态的方式表达了Transformer。所以我认为下一代的人工智能模型将会有更好的性能,也会更安全、更稳健,做更多的事情。
Joel Hellermark:我认为真正令人着迷的是,我们几乎能够从语言中去获得所有信息,建构世界模型。之前您也提到了要教这些模型基础的物理知识,如果这些模型是多模态的,或许在使用中就可以推导出这些物理定律,那我们还有必要去教这些基础知识吗?
黄仁勋:几乎所有的东西都能用文字描述,物理学、牛顿定律这些都已经用文字描述过了,你可以想象我们可以通过世界上的词汇库来学习几乎所有的物理学知识。如果你从来没见过红色,那你很难想象红色意味着什么,但是,如果有足够多的诗歌来描述红苹果的美丽,用红色来表达爱心或者其他东西时,我不会感到惊讶。
把所有这些单词连接起来,通过比较你就能感受到,“哦,这一定是红色的。”你能够在没有亲眼见过的情况下能了解到这一点。如果你没有能力将所有这些不同的事物结合起来,你就永远不会理解事物之间的微妙之处和细微差别。现在我认为教人工智能物理是可能的,但如果你想预测物理定律,想把人工智能建立在物理基础上,这与今天使用强化学习人类反馈来建立大语言模型没有什么不同。
在未来,你会使用强化学习物理反馈来建立大模型。通过某种物理模拟来表达,而不是由人类来实现。我们创建了这个名为Omniverse的系统,它遵循物理定律,这样我们就可以为Omniverse提供本质上是实体机器人的数字孪生。该具体的语言模型将通过Omniverse获得强化学习物理反馈、模拟物理反馈,数字孪生反馈。所以我确认某些类型的机器人需要以物理事实为基础。你想要以道德真理为基础,这就是人性。这两者应该对齐,帮助我们创建更安全的聊天机器人。
Joel Hellermark:你觉得我们目前AI发展的瓶颈在哪里,我们是在现有的模型基础上去改进,还是需要彻底地突破?
黄仁勋:首先,我不太清楚它背后的科学原理,但直觉告诉我,我们的很多应用规则,要么是后天习得的,要么是直接表达出来的。在公司或者社会里,许多原则和规则是通过简单的语言来表达的,不需要人学习,比如“你不能杀人”这并不是我们学会的,是被赋予的,不能违背。很多规则无需学习即可表达出来。我认为某种形式的符号推理可以增强这些已有学习模型。
我不知道这背后的科学原理是什么,但我们的确通过强化学习、经验学习来增强我们的智力。
Joel Hellermark:随着时间的推移,如果人工智能达到了一定的数量级,远远超过了人类的智慧,那这个时候人类应该处于什么位置,还能发挥什么作用?
黄仁勋:我不知道,但是我周围的确有人在某些技能方面比我聪明好几倍,但我和他们共处并没有什么困难。我已经生活在一个被超级智能所包围的环境中,他们能够做一些我无法想象的事。但不知为何,我也能和他们和谐相处。随着时间的推移,我们已提升了很多,我们已经将非常重要的人力资源商品化,也能通过耕种使食物的捕猎民主化,不需要被强制追着食物跑,不再被食物追赶。然后,我们实现权利行使民主化,即使是弱小的人也能在这个世界活得很好。再后来,我们实现了能源获取的民主化,社会生产力得以提高。现在,我认为我们正在实现信息生产的民主化。
那些拥有深厚专业知识的或者对世界有着探索激情的人,仍然会提供更大的价值。
在过去40年的职业生涯中,依然存在相当一部分人没有学会如何使用计算机。你在十几岁的时候可能就开始学习计算机编程了,但对世界上绝大多数人来说,他们不知道Python、Pascal、Fortran、C++或Java。他们不知道如何进行计算机编程。现在有了ChatGPT,可以使用人类的语言进行编程。
AI能做什么
Joel Hellermark:人工智能在应用层面,你最感兴趣的是什么?
黄仁勋:我把它归类为三件事。第一件事就是人工智能可以做什么?它们可以增强、改变我们所做的工作,比如现在我们设计芯片的方式已经完全改变了。
二是,人工智能现在可以让我们做哪些事情,让我们的产品与众不同?它不仅彻底改变了我们设计产品的方式,也彻底改变了我们制造的产品。例如,世界上有很多游戏玩家,用过去构建显卡的方式,设计可编程着色器,我们推出了一款出色的处理器和出色的编译器,并将它们与游戏等集成在一起。但现在你甚至无法单独运送GeForce,因为有一台超级计算机在后面学习如何预测混合丢失的像素。就像玩拼图游戏一样,你给出一块,然后应该猜出其它16块。所以我们教人工智能,我们在后台有一台超级计算机,只是学习如何做到这一点,并改进算法,每当我们改进算法时我们都会下载它。现在,我们使用人工智能不仅革新了我们设计GPU的方式,而且还改变了GPU生成图像的方式。因此,它帮助我们创造了更节能的处理器,其功能超过了“摩尔定律”的预测。
第三点是把整个公司变成一个人工智能。所有的员工都能通过这个一直在运行的系统增强自身能力。这样我们就不会去寻找那些永远找不到的信息,可以把这些点连接起来,去预测市场中的机会。有时候供应链变了或者市场需求变了,我们不可能看到所有的信号,但对于人工智能来说,这并非不能实现。
因此,随着时间的推移,我们了解所需信息的方式、预测需求的方式以及与供应链合作的方式,所有这些都将被人工智能彻底改变。
Joel Hellermark:你现在对人工智能的发展会有逆反观点吗?比如反对它的开发这些。
黄仁勋:我在这方面没有什么逆反的想法。目前大多数关于人工智能的讨论要么超出了对其发展前景的热情,要么超出了对其危险性的担忧,但其实介于发展前景和危险性的极端情况之间的,很可能才是事实。
纵观历史,任何有能力的技术都给社会和经济带来了巨大的变革和中断,所以我们必须要考虑发展技术的风险。以前谁会想到会有一大群人在做网页设计师,这在从前是一个不存在的职业,但今天却变得很火热。人工智能的早期版本就能让我们创建一个全新的行业。现在我们必须重新进行培训,重新掌握技能,以便能够改变被取代的工作岗位。
我相信,将来会有我们从未想过的全新行业被创造出来,例如,现在很活跃的Prompt Engineer(提示工程师),它将是一个巨大的产业,确切说,它可能是最重要的编程行业。你会看到AI正在帮助编写提示,来提示其他AI,这确实非常棒。我喜欢关于安全的讨论,我们必须在人工智能的能力和安全性方面尽可能多地投入。我们恰好也从事自动驾驶汽车领域的工作,可能有同样多的资源投入来确保人工智能和汽车的安全。
构建人工智能相关的技术,以便将其保留在与对齐相关的技术操作领域,强化学习人类反馈,用事实来补充它的学习,降低出错的概率。我们将会看到新想法的爆发,大模型被其他人工智能技术、方法和实践所包围,所有这些行动把大模型变成更有用的聊天机器人。
黄仁勋:创建并经营管理一家公司,要做的第一件事就是从基本原则开始。你创建的这台机器是什么?它的输入是什么?输出是什么?所处的条件是什么?这个行业是怎样的?这是一个快速发展的行业吗?它是受到严格监管的行业吗?你想构建什么?你可以从这个角度来想一下:我想和公司一起做几件事情,我想创造什么东西。NVIDIA的使命是解决那些几乎不可能解决的计算问题。如果一个问题可以用普通计算机解决,我们就不会去做。我们必须去寻找普通计算机无法解决的问题,这样你也能吸引那些想发明新的计算方式并将其应用于解决一些真正困难问题的优秀人才。
其次,我其实想要一家更小的公司,而不是更大的公司。通常公司需要尽可能大才能做好很多工作,但也要尽可能小。如果想要一个服从命令和控制的组织,那么你就把它做成一个金字塔,就像罗马帝国时期的旧军队一样。但如果你想赋予人们权利,就要尽可能地让它变得平坦,这样信息传播得更快。为了使组织结构尽可能平坦,必须充分考虑第一层。第一层恰好是资深工作人员,他们需要的管理最少,我的管理团队中没有一个人会来找我寻求工作建议,他们自己就做得很好。
有很多人向我汇报工作,我不需要一对一进行指导。他们都非常快乐,他们知道自己在做什么,且都是各自领域的专家,所以那些一对一的交流真的没有必要。如果有一个重要的战略方向,你为什么要告诉一个人?你得告诉所有人。因此,当我们在制定未来的发展战略时,我会在某个时间发送给所有人,然后他们会给我反馈,我们再完善它。公司的管理是扁平化的,而且你已经对公司十分了解,再加上给员工充分授权去访问公司的信息,这样公司也很敏捷。
事实证明,通过很多直接下属,而不是一对一,能使公司管理扁平化,信息传播更快、更通畅。我们没有业务部门,也没有分歧,每个人都像一个人一样工作。公司的运行方式使我们能够快速构建加速计算。如果你让我去做炸鸡,或者瑞典肉丸,肯定没有机会,但是在加速计算领域,我们就可以做得很好。
Joel Hellermark:你有40名直接下属?
黄仁勋:对,但我面临的最大挑战是把大家聚在一起。当我想聚一聚的时候,要么有人出去了,或者有人在度假,或者有人在做什么。确切地说,每个人都坐在办公室的概率大约是0%。
Joel Hellermark:随着时间的推移,你的领导风格发生了怎样的变化?
黄仁勋:我真的没有风格,只有我自己,有很多事情我想做的更好。如果工作中发生了什么事,而我不喜欢它的方向,我会直接说出来,不会把任何人拉到一边,不会做一对一指导。这可能有点直接,但人们知道我除了提出问题之外并不想做任何事情。我还花了很多时间对我的决定进行推理和解释,这赋予了员工权力,让他们了解领导是如何思考并作出这个决定的。我参加的每一次会议,都会解释我是如何思考这个问题的,我会推理一下。我认为这种管理过程就是一种赋权。我们也不会只召开副总裁会议,或者董事长会议,我开的会议里都有刚毕业的大学生,他们来自不同组织,都坐在那里。这是一件非常有趣的事情,那里就像我的办公室,大家都聚在一起讨论问题。
我最想要的是见多识广、技能娴熟、经验丰富的人,他们可能曾经遇到过现在出现的问题,他们是能直接解决问题的人,我们需要的是真正的专家。
Joel Hellermark:你为那里的员工提供了怎样的交流模式,你是怎么把优先要做的事情传达下去的?我听说过一些关于发送电子邮件的事情,这是怎么回事?
黄仁勋:我不看任何的状态报告。因为这种报告在你得到它的时候就没有价值了,它几乎不再提供任何信息,它们已经被提炼过,并且加入了视角和偏见,让你再也看不到基本的事实了,所以我倾向于接受任何人提供的信息。如果你发送电子邮件,并将其命名为“最重要的五件事”,无论你的最重要的五件事是什么,是你观察到了什么,做了什么,学到了什么或都只是事情,这都是重要的信息,将其发给我,我都会阅读。所以折合这些,我每天早上的阅读量大约有一百本书那么多,但我每天都会去读。
Joel Hellermark:你是如何去平衡团队决定和你自身的计划?刚才你说的“最重要的五件事”是一种自下而上的想法传递,比如你的团队里资深的工程师,他做了一个决定,那你的战略计划同时也需要执行,你应该怎么去平衡和取舍呢?
黄仁勋:首先,战略不是文字,是行动。如果公司有一套战略,但人们的行动,他们“最重要的五件事”不是这样的,那么显然他们没有执行该战略。所以事实证明,战略并不是我说了什么,而是他们所做的。你得对你的员工在做什么有了解,我甚至都不需要每周阅读他们“最重要的五件事”,只需要进行系统采样,就大致了解他们在干什么,公司有没有在朝着你的目标发展。
其次,我们不做定期规划,因为世界是有生命、会呼吸的。所以我们没有5年计划,也没有1年计划,我就是在做现在正在做的事情,不断地调整和适应。
Joel Hellermark:会不会遇到偏离剧本的情况?是什么让你在这些事情上这么相信自己的直觉?
黄仁勋:公司所追求的大多数事,都应该是通过基本原则推理出来的。如果有一个重要的假设让你相信计算机必须改变,或者芯片架构必须改变,或者软件开发的方式、数据中心必须改变。你不知不觉中,就会形成一种基于第一原则思维的世界观。下一步就是你以足够的奉献精神和信念去追求它,这样你就能实现它,通常这真的很难。但如果你错了,你就会改变主意。现代领导力真正的伟大之处,在于如果我做错了什么,我只会说那是错的,我改变主意了。有趣的是,由于你不断地适应和调整计划,随着时间的推移,人们甚至都不会注意到你在去年已经改变了35次主意。所以我从来不做长期规划,5年计划对技术行业来说实在太荒谬了。
Joel Hellermark:很少有公司真正专注于帮助人们去完成他们的工作,但是你一直热衷于此。这期间,你采取了哪些措施去帮助NVIDIA的员工从事他们毕生的事业?
黄仁勋:为他人创造生活、工作的环境是领导者的使命——实现这一使命的最重要的方式是不让人们做商品工作。
例如,我们公司从不谈论市场份额。我有23%的市场份额,他们有27%的市场份额,这有什么好讨论的。你为什么要和别人争夺市场份额?市场份额的整体概念表明,有一大群人在做同样的事情。如果他们在做同样的事情,我们为什么要这么做?为什么我要浪费这些才华横溢的人的生命去做一些已经做过的事情?除非我们只是享受竞争(但我不享受竞争)。所以我们不会去和人们争夺已经商品化的市场,这是一种去做以前从未做过的事情的思维方式。
证明这一点的另一方面就是,放弃已经商品化的业务。我们过去已经放弃了许多业务,这向员工清楚表明,我们不会去做商品工作。因此,选择正确的工作和远离错误的工作相结合,这是为员工创造环境的最佳方式。剩下的就是你我已经讨论过的问题,即赋予员工获得信息的权利。
有些公司是非常沉默的,信息不对组织之外传播,我鼓励我们公司保持透明。赋予人们获取信息的权利,剩下的就看你在工作中如何表现自己了。如果公司里存在等级观念,那么显然这就没有赋权。但如果任何人都能参加会议并作出贡献,哪怕是一个刚毕业的大学生,这就赋权到位了,所以我认为赋权是一件非常重要的事情。
新闻热线&投稿邮箱:[email protected]