Demis Hassabis - Future of AI, Simulating Reality, Physics and Video Games - AI的未来、现实模拟、物理与游戏
EN
Click to see a more reader friendly version of this content (点击查看视觉效果更好的版本)
CN
Key Logic
这次对话围绕Demis Hassabis提出的一个引人深思的猜想展开,即自然界中“任何可生成或被发现的模式,都能被经典学习算法高效发现和建模”。他通过Google DeepMind在AlphaFold和AlphaGo上取得的突破,以及VEO模型在模拟液体等物理现象方面的惊人能力,来支撑这一观点。核心在于,自然界并非随机,其复杂的结构和演化过程意味着存在可学习的低维流形,使得AI能够高效地“逆向学习”物理规律。对话还深入探讨了AGI的定义、实现路径与衡量标准,AI对未来游戏开发和社会(包括就业、资源分配和治理)的深远影响,以及AI在科学研究(如生命起源、细胞模拟)中的潜力,同时不回避AI带来的风险和人类面临的哲学问题,最终强调了AI作为终极工具,如何帮助人类理解宇宙本质及自身存在的意义。
AI对物理世界理解和建模的能力
- Lex Fridman开场指出,人类很难对高度非线性的动态系统做出清晰预测,但Demis Hassabis的观点是,经典学习系统在处理流体动力学等问题上可能带来惊喜。
- Demis Hassabis(Google DeepMind CEO)表示,流体动力学和纳维-斯托克斯方程传统上被认为是经典系统难以处理的问题,需要巨大的计算量。
- Lex Fridman提到Demis Hassabis在Nobel Prize演讲中提出的一个“超级有趣的猜想”:任何可生成或被发现的模式,都能被经典学习算法高效发现和建模。
- Demis Hassabis解释说,在Nobel Prize演讲中保持一点“挑衅性”是传统。
- Demis Hassabis以蛋白质折叠为例,说明自然系统为何能被有效建模。
- “蛋白质在我们的身体里以毫秒计的时间内折叠。物理学是如何解决这个问题的?现在我们也能通过计算解决。”
- 他认为这是因为自然系统具有结构,它们经历了塑造它们的进化过程。
- “如果这成立,那么也许我们可以学习这种结构是什么。”
- “你可以称之为‘最稳定者的生存’,因为生命有进化,地质时间也有例如山脉的形成受风化过程塑造,甚至宇宙学上行星的轨道、小行星的形状都经历过多次作用过程。”
- “所以,如果这是真的,就应该存在某种模式,你可以逆向学习,一种流形,帮助你搜索到正确的解决方案,从而高效预测事物。”
- 他指出,人工创造物或抽象事物(如大数分解)可能不适用,除非数字空间中存在模式。
- “但我们感兴趣的大多数自然事物并非如此。它们具有结构,因某种原因而进化并存活下来。如果这是真的,我认为Neural Network有潜力学习它们。”
- Lex Fridman总结道,大自然本身就像一个搜索过程,它创造的系统能够被高效建模,从而被高效地重新发现或恢复,因为自然界并非随机。
- Lex Fridman询问是否可以提出一个新的复杂性类别,来定义那些可以被经典系统有效建模的“可学习自然系统”(LNS)。
- Demis Hassabis坦言自己一直是P=NP问题(P equals NP problem)的爱好者,并认为这正是他们团队正在研究的课题:是否存在一类可以用Neural Network过程解决,并映射到自然系统(物理学中存在结构的事物)的问题。
- 他认为“信息是宇宙最基本单位”,比能量和物质更基本,宇宙是一个信息系统。
- Lex Fridman回应说,如果把宇宙看作信息系统,那么P=NP问题就变成了物理学问题,可以帮助我们解决“整个事情”。
- Demis Hassabis认为,AlphaGo和AlphaFold证明了经典系统(图灵机,在普通计算机上运行的Neural Network)的能力远超预期。
- 他认为AI界尚未触及经典系统的能力极限,而AGI(Artificial General Intelligence)建立在Neural Network之上,将是这种能力的终极体现,其界限与P=NP问题直接相关。
- Lex Fridman询问是否可以提出一个新的复杂性类别,来定义那些可以被经典系统有效建模的“可学习自然系统”(LNS)。
- Lex Fridman询问,是否存在AI无法建模的现象,例如细胞自动机中的涌现现象。
- Demis Hassabis认为这些系统在边界上。
- Lex Fridman提到AlphaFold 3在交互方面的突破和AlphaGenome。
- Demis Hassabis同意,这些进展令人惊讶,因为它们揭示了“存在某种结构,某种能量景观,你可以沿着梯度进行。而Neural Network非常擅长沿着梯度前进。”
- “你不需要处理所有复杂性,几十年来我们可能天真地认为这些问题只能通过枚举所有可能性来解决,那看起来完全不可处理。”
- “例如,可能的蛋白质结构有种,Go的可能局面有种,这些都远超宇宙中的原子数量。”
- “但事实证明这是可能的。蛋白质确实会折叠。这给了我们信心,如果我们理解了物理学是如何做到的,并能模仿这个过程,那么在我们的经典系统上也是可能的。”
- Lex Fridman和Demis Hassabis再次强调了高度非线性动态系统,尤其涉及流体的系统,在经典计算中遇到的困难,以及VEO在这方面的突破。
- Demis Hassabis重申VEO在模拟液体、材料、镜面光照方面的出色表现。
- “这很神奇,这些系统竟然是通过观看YouTube视频来逆向工程的。”
- “这意味着它正在提取这些材料行为的底层结构。也许存在一种低维流形,如果我们真正理解了其内部机制,就可以学习到它。”
- Demis Hassabis重申VEO在模拟液体、材料、镜面光照方面的出色表现。
- Lex Fridman对VEO的物理模拟能力持续震惊。
- 他指出,虽然扩散模型的怀疑论者认为它不理解任何东西,但VEO的表现似乎超越了简单的模式匹配。
- Demis Hassabis认为,VEO能够预测连贯的下一帧,这本身就是一种“理解”的形式,尽管不是拟人化的哲学理解。
- Demis Hassabis认为,VEO的成功暗示了“现实本质之下的一些东西”,并设想未来可以制作交互式视频。
- “这将是迈向‘世界模型’的一步,即世界如何运作的力学原理,以及世界中的事物。”
- “这正是真正的AGI系统所需要的。”
AI与游戏的未来
- Lex Fridman提到了Demis Hassabis关于VEO视频转变为可玩世界模型的X推文。
- Demis Hassabis表示游戏是他最初的热爱,也是他职业生涯早期构建AI系统的领域。
- 他梦想着如果当年(20世纪90年代)能有今天的AI系统,可以构建“令人震惊的游戏”。
- 他专注于“开放世界游戏”,其中有模拟、AI角色,玩家与模拟互动,模拟根据玩家玩法进行调整。
- “这样的游戏(如Theme Park)中,每个人的游戏体验都是独一无二的,因为你是在共同创造游戏。”
- 开放世界游戏很难编程,需要为玩家可能去的任何方向生成内容。
- 过去依赖细胞自动机等经典系统创造涌现行为,但它们“有点脆弱,有点局限”。
- “而现在,我们可能在未来5到10年内,拥有能真正根据你的想象力创造的AI系统。”
- 它们能“动态改变故事,围绕叙事进行讲故事,无论你选择什么,都能使其富有戏剧性”。
- “这就像终极的‘选择你自己的冒险’游戏。”
- 他认为,这是一个交互式VEO的未来版本。
- Lex Fridman强调了这种开放世界游戏中的“深度个性化”,即玩家的选择定义了他们所看到的世界,而非仅仅是选择的幻觉。
- 他以Stanley Parable为例,说明许多游戏提供的只是选择的“幻觉”。
- 但他也提到The Elder Scrolls系列中的Daggerfall,利用随机生成地牢来创造开放世界感。
- Demis Hassabis认为,未来的游戏需要比简单随机生成更好,也比简单的A/B硬编码选择更好。
- Demis Hassabis表示,他希望能在忙碌的日程中找到时间,通过“即兴编码”(Vibe Coding)来做个人项目,甚至在AGI成功后,他的“后AGI项目”之一就是游戏。
- 他认为游戏和P=NP问题(P equals NP problem)在某种程度上是相关的,因为开放世界模拟游戏追求现实,这与“宇宙是什么”的问题相通。
- Lex Fridman认为,随着AI承担更多“无聊”的任务,游戏可能成为人类寻找意义和打发时间的方式。
- Demis Hassabis同意,游戏能让想象力驰骋。
- 他认为游戏行业在20世纪80年代、90年代和2000年代早期是“黄金时代”,因为新的娱乐媒介(开放世界和模拟游戏)被创造出来。
- “你作为玩家共同创造故事,这是其他娱乐媒体所没有的。”
- 他提到多人游戏也成为社交活动。
- Demis Hassabis同意,游戏能让想象力驰骋。
- Demis Hassabis强调了游戏在训练决策能力和处理输赢方面的价值。
- “游戏是现实世界的微观模拟,它们是简化版,让你可以在安全、可重复的环境中练习决策过程。”
- “输赢的练习也很重要,就像柔术一样,你可以在一个安全的环境中被击败,这提醒你物理法则,提醒你世界如何运作。”
- 他认为这种经历有助于自我提升和自我认识,避免胜利时的自满,从失败中学习。
- “人类对这些数字上升上瘾,也许这就是我们这样制作游戏的原因,因为我们自己就是‘爬坡系统’。”
AGI的定义与衡量
- Lex Fridman提到Demis Hassabis预测2030年有50%的几率实现AGI。
- Demis Hassabis强调,这取决于AGI的定义。他的定义门槛很高:“我们能否匹配大脑的认知功能?”
- “我们的大脑是近似的通用图灵机,并通过它们创造了现代文明,这说明了大脑的通用性。”
- 为了确定一个真正的AGI,需要确认它拥有所有这些能力,而不是像目前系统那样“不均衡的智能”(某些方面擅长,某些方面有缺陷)。
- 目前系统缺乏“真正的发明能力和创造力”。
- 测试方法可以是“对数万个认知任务进行暴力测试”,或者“让全世界最顶尖的专家(如Terence Tao)在1到2个月内找出系统明显的缺陷”。
- Demis Hassabis强调,这取决于AGI的定义。他的定义门槛很高:“我们能否匹配大脑的认知功能?”
- Lex Fridman反驳说,人类很容易对AI的进步习以为常。
- Demis Hassabis同意,除了全面的测试外,还需要寻找“灯塔时刻”(lighthouse moments),如AlphaGo的
move ==37==
。
- Demis Hassabis同意,除了全面的测试外,还需要寻找“灯塔时刻”(lighthouse moments),如AlphaGo的
- Lex Fridman提出,AI能否拥有“研究品味”或“判断力”,这通常是杰出科学家与优秀科学家的区别。
- Demis Hassabis认为,这是最难模仿或建模的品质之一。
- “这正是伟大科学家与优秀科学家的区别所在。所有专业科学家在技术上都很优秀,但他们是否有品味去嗅探正确的方向、正确的实验、正确的问题?”
- “挑选正确的问题是科学中最难的部分,提出正确的假设也是。”
- 他认为今天的系统还做不到,提出一个好的猜想比解决它更难。
- “一个好的猜想应该是有趣且易于证明的,它能将假设空间一分为二,就像二分查找一样。”
- “在真正的蓝天研究中,没有失败这回事,只要你选择的实验和假设能有意义地分割假设空间。”
- Demis Hassabis认为,这是最难模仿或建模的品质之一。
AI在科学研究中的潜力
- Lex Fridman提及Demis Hassabis模拟细胞的梦想,并引出AlphaFold、AlphaFold 3和AlphaGenome的突破。
- Demis Hassabis解释说,他一直尝试将宏大梦想分解为可管理、有意义的中间步骤。
- 他将模拟细胞的项目称为“虚拟细胞”(Virtual Cell),这个想法已经有25年之久。
- 他与生物导师保罗·纳斯(Paul Nurse,2001年Nobel Prize得主)讨论过,目标是模拟细胞内部的所有过程,从而在“硅中”进行实验,将湿实验室实验速度提高100倍。
- AlphaFold解决了蛋白质的静态3D结构,而AlphaFold 3是迈向建模动态交互的第一步。
- 他会从研究最透彻的单细胞生物“酵母细胞”开始模拟,因为它是一个完整的有机体。
- 下一个目标是建模整个通路(如癌症相关的mTOR pathway),最终是整个细胞。
- Lex Fridman询问细胞内不同时间尺度(如蛋白质折叠很快,其他机制很慢)的复杂性。
- Demis Hassabis表示这将很棘手,可能需要多个在不同时间尺度上交互的模拟系统,或者是一个分层系统。
- “模型中需要有一个截止粒度级别,以捕捉你感兴趣的动态。对于细胞,他希望可以在蛋白质级别进行建模,而不需要深入到原子级别。”
- Demis Hassabis解释说,他一直尝试将宏大梦想分解为可管理、有意义的中间步骤。
- Lex Fridman询问是否有可能模拟生命起源。
- Demis Hassabis认为这是最深刻、最迷人的问题之一。
- 他提到尼克·莱恩(Nick Lane)的《进化的10项伟大发明》(The Ten Great Inventions of Evolution),其中提到单细胞到多细胞的飞跃花了10亿年。
- 他认为AI在模拟生命起源方面也能有所帮助,这涉及在组合空间中进行搜索。
- “如果能够从化学液体中生成类似细胞的东西,那将是虚拟细胞项目之后的下一个阶段。”
- 他希望生命起源也能有一个“move 37”(指Go中出人意料的创新棋步)。
- 他认为,生命与非生命之间没有明确界线,而是一个连续体,连接了物理学、化学和生物学。
- “这就是我一生都在研究AI和AGI的原因,因为我认为它可以成为帮助我们回答这类问题的终极工具。”
- 他好奇为什么人们不更多地思考“生命”的定义、时间的本质、意识和重力等基本问题。
- Demis Hassabis认为这是最深刻、最迷人的问题之一。
- Demis Hassabis提到Google DeepMind在天气预测上的进展。
- “我们创建了世界上最好的天气预测系统,它们比传统的流体动力学系统更好,后者通常在大型超级计算机上需要数天才能计算出来。”
- “通过我们的WeatherNet系统,我们成功地用Neural Network系统模拟了许多天气动态。”
- 这再次证明了即使复杂如混沌系统,其有趣的部分也能被Neural Network建模,例如飓风路径预测。
AI与社会影响
- Lex Fridman询问AI对程序员就业的影响。
- Demis Hassabis认为,编程和数学等“硬技能”对于AI来说反而更容易,因为可以生成大量的合成数据并验证其正确性。
- 他预测在未来5到10年,那些拥抱AI技术的人将变得“超人般地高效”。
- Lex Fridman提到AI可能改变不同类型编程的价值。
- Demis Hassabis承认,任何技术颠覆都会带来巨大的变化,但也会创造新的工作岗位,就像互联网一样。
- “这次变革的影响可能是工业革命的10倍,但速度会快10倍。”
- “这意味着它的速度和影响将结合起来达到100倍。”
- 他呼吁顶尖经济学家和哲学家思考社会如何应对,例如“全民基本供给”的想法。
- Demis Hassabis承认,任何技术颠覆都会带来巨大的变化,但也会创造新的工作岗位,就像互联网一样。
- Demis Hassabis认为,当前的首要任务是创造更多资源丰裕,然后才是如何分配的问题。
- 他提到本杰明·利维图特(Benjamin Labatut)的《狂人之梦》(The Maniac)一书,书中约翰·冯·诺伊曼(John von Neumann)预见到计算机会比原子弹产生更大的影响。
- “AI是一种多用途技术,能解决所有疾病、能源和稀缺性问题。”
- Demis Hassabis强调,除了技术进步,还需要关注哲学的、人文的层面。
- Demis Hassabis对“人类文明自我毁灭的概率”(p_doom)持不确定但非零的态度。
- Lex Fridman提到了Lee Sedol在Go中对AlphaGo下出的
move ==78==
。- Demis Hassabis认为这是一个“特殊时刻”,双方都在互相激励,人类的独创性与AI工具相结合。
- 他认为,随着AI变得更智能,人们会思考“人类的特殊性”在哪里。
- 他通过AI的构建来探索人类思维的特殊性,怀疑意识是否可以被经典计算机模拟。
- 他认为大脑很可能基于经典计算,因此所有现象都应该可以被经典计算机模拟或模仿。
- 他提出,通过脑机接口,我们或许能“感受”在硅上计算是怎样的体验。
- Demis Hassabis展望人类文明的未来,充满希望。
- “人类几乎无限的创造力是我的希望之源。”
- “人类大脑是通用系统,其潜力几乎是无限的。”
- “另一个是人类极强的适应性。我们现在用狩猎采集者的大脑来应对现代世界,这证明了我们的适应力。”
- 他认为人类对“好奇心、适应性、同情心和爱的能力”是独特且珍贵的。
Google DeepMind的竞争与文化
- Lex Fridman提到Google在LLM产品方面从“落后”到“领先”的转变。
- Demis Hassabis归因于:
- “我们拥有令人难以置信的团队”,包括杰出的领导者和团队成员。
- “拥有大量计算资源”。
- “我们创造的研究文化”,将Google Brain和老DeepMind的最优秀人才和想法汇集起来。
- 他强调DeepMind像一家“创业公司”一样运作,具有高层的决策力和小型组织的活力。
- “我们试图兼顾两个世界的优点,一方面是拥有数十亿用户的平台,另一方面是我们能用AI和研究来赋能的令人难以置信的产品。”
- “我们不断努力削减官僚主义,让研究文化和‘不懈交付’的文化蓬勃发展。”
- Demis Hassabis归因于:
- Lex Fridman提到Google的AI模式让普通人接触到AI,例如大英博物馆的Irving Finkel博士。
- Demis Hassabis认为,虽然科技界热衷于AI,但许多普通人尚未接触。
- Lex Fridman提到Demis Hassabis同时也是优秀的产品经理。
- Demis Hassabis认为,这源于他早年为数百万玩家设计游戏的经验。
- 他热爱将前沿研究应用于产品,并创造新的体验。
- “这实际上是同一种技能,即直观地想象如何使用它,并拥有良好的品味。”这在科学和产品设计中都很有用。
- 他认为自己是一个多学科的人,不认为艺术、科学、产品和研究之间存在界限,而是一个连续体。
- 他指出,AI产品经理需要“非常技术化”,因为他们必须预测AI技术在6个月或1年后的发展,而不仅仅是当前。
- “模型正在以令人难以置信的速度进步,你必须为未来设计,而不是现在。”
- “你必须有很好的直觉,预感研究轨迹是否能及时与你的梦想产品相遇。”
- 他认为当前文本框式的UI很快会过时,未来会是更像《少数派报告》(Minority Report)的多模态、协作式界面。
- 他认为界面设计是一种被低估的艺术形式,它能“释放系统的力量”。
- “简单、美观和优雅是我们想要的。”
- 他预测未来将进入一个由AI生成界面的时代,这些界面将根据用户进行个性化。
- Demis Hassabis认为,这源于他早年为数百万玩家设计游戏的经验。
- Lex Fridman好奇Gemini 3何时发布。
- Demis Hassabis解释说,版本更新大约需要6个月。
- “在这段时间里,许多新的有趣研究迭代和想法会涌现出来。”
- 他们会收集这些想法(架构、数据等方面),然后捆绑起来进行一次“巨大的英雄训练运行”(hero training run)。
- 版本号通常指基础模型(预训练模型)。而2.5的中间版本和附加功能,则是后训练(post-training)的成果。
- 他们还会提取出不同大小的模型(Pro、Flash、Flashlight),形成一个帕累托前沿,满足不同开发者对性能、速度和成本的需求。
- Demis Hassabis解释说,版本更新大约需要6个月。
- Lex Fridman询问基准测试的有效性。
- Demis Hassabis认为基准测试是必要的,但不能过度拟合。
- 他们有内部基准,目标是构建“全面优秀的通用系统”,而非只擅长一件事。
- “你希望做到‘不后悔的改进’,即提高编码能力,同时不降低其他领域(如语言、翻译)的性能。”
- 他们还需要关注实际产品使用中的信号和最终用户的反馈,因为“最终你想要衡量的是实用性”。
- 他承认,除了性能和实用性,还有“风格”和“个性”等更抽象的方面,例如AI是冗长还是简洁,是否幽默,这涉及心理学和人格研究。
- Demis Hassabis认为基准测试是必要的,但不能过度拟合。
- Demis Hassabis反对将AI视为“赢”或“输”的比赛,因为它事关重大。
- “我们这些处于前沿的人有责任,将这种不可思议的技术安全地推向世界,造福人类。”
- 他尝试与所有主要实验室的负责人保持良好关系,因为研究是“协作性工作”,尤其是在安全等问题上。
- 他认为科学是一种“美丽的连接器”,希望通过多文化、多学科的团队合作,避免冲突。
- Demis Hassabis认为,与Meta等公司高薪挖角相比,真正的AGI信徒更看重“研究前沿”和“使命”。
- Demis Hassabis对数据稀缺问题不担心。
- “我认为存在足够的数据,并且已经证明可以将系统训练得很好。”
- 他认为有了足够多的真实世界数据,就可以生成“合成数据”,进行模拟。
- Lex Fridman询问计算扩展对于构建AGI的重要性,以及Google DeepMind的能源关注。
- Demis Hassabis认为,多方面因素驱动计算的持续扩展,包括训练、推理和“思考系统”(Thinking Systems,即测试时推理时间越长越智能的系统)。
Lex Fridman的个人反思与哲学观点
- Lex Fridman在对话末尾分享了David Foster Wallace名为《这是水》(This Is Water)的毕业演讲。
- 演讲核心思想:“最明显、最重要的现实,往往是最难看到和谈论的。”
- 他从中得到的启示:
- 必须质疑一切,特别是对现实、生命和存在本质的最基本假设。这是一个深刻的个人发现过程。
- 生命中的“精神战役”不在山顶或冥想中,而是在日常生活的平凡时刻中进行。
- 我们太容易将时间和注意力浪费在世界的各种“分心”上,这些是“注意力的黑洞”。
- David Foster Wallace呼吁“深入感受每一个瞬间的美,并在平凡中寻找意义”。
- 他引用理查德·费曼的观点,科学对花的了解,只会增加其美感和奇迹。
- 他讲了一个酒吧里的无神论者和信徒的故事,说明“一切都取决于视角”,而谦逊地拓宽视角才能获得智慧。
- Lex Fridman分享了自己被“在线攻击”的经历,关于他在MIT和Drexel的学历和职位。
- Lex Fridman认为,人工智能的进步最终会迫使技术人员与全人类进行更深入的哲学对话,思考“何为人性”以及技术如何服务人类。
#Artificial_Intelligence #AGI #Machine_Learning #Deep_Learning #Neural_Networks #Fluid_Dynamics #Protein_Folding #Genomics #Video_Generation #Robotics #Computational_Physics #Game_Theory #Open_World_Games #Reinforcement_Learning #Scientific_Discovery #P_NP_Problem #Virtual_Cell #Evolutionary_Algorithms #Computer_Vision #Weather_Prediction #Energy_Solutions #Fusion_Energy #Solar_Energy #Kardashev_Scale #Resource_Abundance #Societal_Impact #Job_Displacement #Universal_Basic_Provision #Ethical_AI #AI_Safety #Consciousness #Human_Nature #Philosophy_of_Science #Product_Design #User_Interface #UX #Google_DeepMind #AlphaGo #AlphaFold #Gemini #VO #Lex_Fridman #Demis_Hassabis #John_von_Neumann #Richard_Feynman #David_Foster_Wallace