-
塞巴斯蒂安·马拉比 《哈萨比斯:谷歌AI之脑》
引言 普罗米修斯的回声:点燃智能之火,锻造全能之机
-
AI 带来的变革将比自从大约 7 万年前智人获得抽象思维能力以来的任何事件都更为深远。
-
哈萨比斯阐述了自己毕生追求的终极目标:探索机器超级智能。在伦敦北部长大的他,曾认定有两个领域最值得探究:物理学和神经科学。物理学解释从粒子行为到宇宙运行的外部世界,神经科学则探索内部世界——由神经元、突触和电脉冲构成的智能。后来 20 多岁时,哈萨比斯就得出结论:内部胜过外部,两者之间神经科学更加重要。智能是本,是万物之根,是人类感知现实的机制。
-
遵循费曼的格言(我无法创造的东西,我就无法理解),科学家若要理解人类智能,就必须构建出一个人工模型:一台能模仿人类思维的机器。AI 的实际应用或商业价值只是次要考量。
-
创造新技术本身就是人类的固有天性。正如科技乐观主义者里德·霍夫曼所批驳的:“我们依然倾向于将技术视为去人性化的力量,而非塑造我们本质的东西”。笛卡尔曾说“我思故我在”,或许我们还应加上:我想象故我在,我假设故我在。发明的冲动深植于我们每个人的心底。
-
发明者的困境:当他们遇到将令人生畏的事物带入世界的机会时,探索的快感——那种伊卡洛斯式的本能就变得难以抗拒。
-
探索的诱惑实在是太大了。辛顿回应原子弹之父 J.罗伯特·奥本海默的观点:当你看到某个技术上极具影响力的事物时,你会忍不住去做,只有在技术上取得成功后,你才会去争论该如何应对它带来的问题。
-
哈萨比斯坚信,除非社会真正理解变革性技术发明者的内心动机,否则人们永远不会信任他们。
第一部分 超级智能前夜:DeepMind 如何成为谷歌的秘密武器
第 1 章 人生没有备用棋局:哈萨比斯的试炼与燃烧式成长
-
大约 15 年后,40 多岁的哈萨比斯坐在伦敦一家餐厅里,与我相对而坐,回忆着这个故事给予他的力量。我们谈及这个话题并非偶然。哈萨比斯曾特意建议我在与他第一次长谈前先读《安德的游戏》这本小说,这是他想深入探讨的话题。如果我想真正了解他,就必须理解他在科幻作品中的“另一个自我”:那种在磨难中坚持前行、承受痛苦却依然奋进的能力。和安德一样,哈萨比斯为了完成使命倾注了全部心力,除了常规的办公时间,他还经常从晚上 10 点工作到凌晨 4 点左右。和安德一样,哈萨比斯也肩负着沉重的责任感。“当你试图解决人类面临的问题、理解现实的本质时,你没有任何时间可以浪费。”他说。
-
他父亲说,无论输赢,真正重要的是你尽了最大的努力。德米斯说他逐字逐句理解了这句话。也就是说,要付出绝对、绝对、绝对的全部努力,几乎到拼尽全力的地步。
-
我唯一知道真的尽了最大努力的方法,就是把自己逼到濒临崩溃的边缘。因为只有到那一刻,你才算真正尽了全力。如果你倒下了——我说的倒下,是指精力耗尽之类的情况,那就说明你稍微过度了。
-
这种社交的孤立似乎助长了他狂热的驱动力,由于缺乏友情的支撑,他获得认可的唯一途径就是取得非凡的成就。
-
如果模式——那些由遗传密码控制的电信号脉冲才是关键,那么类似的模式也可以被编码到人工大脑中。大脑能做的事情,计算机总有一天也能做到。
-
总而言之,哈萨比斯在牛蛙公司的经历回答了他在列支敦士登失利后心中的那个重大问题:他的使命和目标将是构建 AI。莫利纽克斯和《哥德尔、艾舍尔、巴赫》播下了种子:计算机很快就能做到大脑能做的任何事情。伊恩·班克斯提供了一个乌托邦式的愿景,展示了 AI 实现后可能带来的意义:人类的无限繁荣。而卡内基梅隆大学的那位教授则无意中证明了哈萨比斯具备未来所需的才能——如果他能在进入大学之前就给以为著名科学家留下深刻印象,那么他未来的成就将不可限量。
第 2 章 深刻的哲学问题:一场探索万物的游戏
-
这部电影对哈萨比斯的重要性,堪比伊恩·班克斯的“文明”系列对他世界观的影响。哈萨比斯曾数次辍学,他的想法也常让父母难以理解。他的雄心壮志是在一次次各式各样的经历中逐渐成形的。“我对知识来者不拒,”他说,“任何知识我都愿意吸收,棋类、游戏、哲学,我全盘接纳。”但《生命的故事》这部电影还让他看到了别的东西。多种因素共同推动着哈萨比斯走向 AI 领域,但最强大的驱动力或许是探索的乐趣,是对揭开表象背后真相的期待。
-
哈萨比斯之所以能选择回避冲突,是因为他有另一种赢得他人尊重的方式。无论是国际象棋、西洋双陆棋,还是桌上足球,他都能击败所有人。从这个角度来说,他温和友善的态度和强烈的好胜心是一体两面。一方面,哈萨比斯喜欢在学院酒吧里玩桌上足球,娴熟地猛拉和旋转球员小人,这种大众化的爱好彰显了他的亲和力;另一方面,他对这款游戏极为痴迷,还组建了学院队,在学校里击败了所有对手。
-
每一条规则都有无数例外情况,知识不能分解为孤立的公理,理解也不仅仅是通过逻辑推理实现的。
-
哈萨比斯和西尔弗也不知道如何编写归纳法程序,但至少他们找到了正确的问题方向。AI 科学家们必须克服对“可证明正确”的演绎逻辑的依赖,否则,构建智能系统的努力将会陷入一个矛盾的困境。智能的本质是能够灵活应对复杂情况,符号编程却是将僵化的规则输入僵化的机器中。僵化之上再加僵化,永远无法产生灵活的智能。要摆脱这一矛盾,未来的科学家必须发明一种新型机器,一种能够从海量数据中发现模式的机器。
-
与多格曼的交流让哈萨比斯有了新的顿悟。他意识到,一台超人类计算机不仅仅是实现科学目标(推动科学认知进步)的手段,它本身可能就是目标。因为在计算机科学的助力下,信息才是现实的基本单位。传统上被认为是现实基本构成要素的能量和物质,相比之下远没有那么有说服力。只有信息才能为解释所有经验事实提供基础,粒子的行为、能量的流动,甚至人类的意识,都可以被视为信息处理的例子。
当然,哈萨比斯早已从侯世达的思想中汲取了这一观点的精髓。侯世达认为,生物学本质上是一个信息处理系统,定义生命的不是肌肉或组织,而是赋予它们生命的信号。“但在多格曼的影响下,哈萨比斯进行了更深入的研究,学习了克劳德·香农关于信息的理论:信息如何被量化、存储和在时间与空间中传输。香农用一个简单却深刻的观点定义了信息:信息是不确定性的对立面。从这个角度来看,任何不确定性的减少都依赖于经过智能处理的信息。“万物理论”,也就是一种能将不确定性无限趋近于零的理论,极有可能以计算机程序的形式呈现。
-
如果信息是构成现实的基本单位,那么在此基础之上又是什么呢?对香农来说,答案是计算,即处理信息、传输信息并从中获取意义的过程。这一洞见促使香农对尚未存在的计算机进行了理论构想:它们需要存在,因此它们将会存在。但近半个世纪后,正如哈萨比斯和西尔弗所观察到的,计算技术似乎陷入了僵局。或许解决之道是再上一个层次,从第一层次的信息,到第二层次的人类设计计算,再到第三层次的、能够自主设计计算方式的机器。这类机器,也就是 AI 系统或能够自主设计程序的程序在当时几乎还不存在,但它们无疑能填补一个明显的空白。如果人类缺乏教会机器归纳法的智慧,那么未来的无限机器就会学会自主解决这个问题。和之前的香农一样,哈萨比斯和西尔弗相信,这样的系统需要存在,因此它们将会存在。
-
在随后的几年里,哈萨比斯的这两点顿悟一直指引着他。首先,信息是现实的基本单位;其次,一台能够自主学习并归纳自然规律的机器,是理解现实最强大的工具。AI 不仅能拓展科学的前沿,还能做更多事情:研发药物、延长人类寿命、解决核聚变面临的障碍、实现清洁能源的充足供应。正如哈萨比斯曾对英国《观察家报》(Observer)所说的,AI 将应对一系列宏大的挑战,包括“癌症、气候变化、能源问题、基因组学、宏观经济学以及金融系统”。一台能够处理海量数据的无限机器,其影响力也将是无限的。
-
“对别人做的最糟糕的事情就是控制他们,”哈萨比斯再次对我说道,“我努力避免成为那样的人。”
第 3 章 绝地武士:从万灵药工作室到 AI 的旅程
-
创业往往能在硅谷这样的集群环境中蓬勃发展,在那里,技术人员通过相互学习、彼此借鉴来掌握如何展现出稳健的自信。
-
站在悬崖边上,身处险境之中,哈萨比斯成功施展了他有史以来最厉害的“绝地念力”。
-
哈萨比斯不得不反思自己的魅力与固执之间、讲故事的天赋与自我欺骗的风险之间、激励他人的神奇能力与无意中伤害他人的风险之间那条微妙界限。
-
有魅力的人不能简单地用好坏来定义。如果他们一直坏,就会众叛亲离,而一个领导者有魅力却没有追随者本就是个悖论。同样,有魅力的领导者也不可能一直温和友善。在人生的起起落落中,利益和观点的冲突在所难免,总有人要战胜另一些人。凭借他们非凡的天赋,无论有魅力的人多么真诚地希望避免控制他人,最终都会凌驾于他人之上。
-
有魅力的人不仅仅是不可避免地在激励他人和控制他人之间摇摆,这种摇摆本身就是魅力的一部分。追随者会对领导者多变的情绪上瘾,就像赌徒会对那些一次次让人失望,却又偶尔能带来巨额奖金的老虎机上瘾一样。如果老虎机每次都吐出相似的奖励,这款游戏就失去了吸引力。
-
基于僵化逻辑训练出来的僵化机器,永远无法实现灵活的智能。相反,正如香农所说,机器应该通过试错来学习。它们应该与世界互动,接收反馈,并利用反馈来微调自己的行为。萨顿的教科书详细阐述了实现这种方法的思路,这种方法被称为“强化学习”。
-
AI 是一个能够自主学习如何解决问题的系统。你要构建的是一个不需要人类指令就能自行解决问题的系统。
-
重建自我的最佳方式就是回归学习。
-
如果记忆是被重建的,那么或许它的大脑机制与想象力相同。诚然,记忆和想象力的目标是相反的。记忆涉及的是真实发生过的事件,而想象力则刻意创造新颖的事物。但构建生动意向的过程,无论追溯历史,还是虚构未来,似乎都存在着深层联结。记忆是回顾性的,而想象力常常是展望未来的。哈萨比斯想起了《爱丽丝镜中奇遇记》中的一句话。“只能回想过去的记忆可算不上什么好记忆。”白皇后对爱丽丝说。
-
对哈萨比斯来说,学术上的赞誉只是其中一部分乐趣。他更感兴趣的是这项研究对他一直关注的存在主义问题所具有的意义。如果记忆不是对某种客观外部现实的记录,而是大脑创造的模拟影像,那么或许整个现实都可能是一种精神建构。在我们的一次长谈中,哈萨比斯这样告诉我:“世界的结构本质上是由心智创造的,我想用我的神经科学研究来证明这一点:现实可能是一种模拟。”
-
“我喜欢康德的观点,即外部世界本质上是一种精神建构。”哈萨比斯现在再次向我强调。物理学家所研究的物质、能量、时间,最终都不如神经元之间传递的信息真实。
-
一台模拟有限世界的电脑,可以被视为一个有限的上帝;而一台未来的电脑,一台强大的 AI,或许会是无限的、无所不能的。
第 4 章 AI “三人组”:DeepMind 英雄之旅启程
-
这些过渡性项目并没有让哈萨比斯热血沸腾,此时他已经 32 岁,深刻意识到时不我待,是时候更直接地追求自己毕生的抱负了。
-
后来,波吉奥表示,在他遇到过的众多诺贝尔奖得主中,大多数人既才华横溢又运气极佳。这里的运气指的是,他们选择的研究课题最终被证明既有重大意义又切实可行。但波吉奥说,有少数诺贝尔奖得主天赋异禀,无论从事什么研究都注定会获奖。在这一类人中,波吉奥列举了物理学家理查德·费曼、生物学家弗朗西斯·克里克,以及他的博士后学生哈萨比斯。
-
温斯顿否定了他的观点,却没有说出任何哈萨比斯以前没听过的新鲜内容。这一点恰恰证明,创办一家 AI 公司至少是与众不同、敢于挑战传统的。但无论他如何自我安慰,哈萨比斯面临的困难依然巨大。除非有人相信他的理念,否则他根本无法创办公司。一个没有追随者的叛逆者,终究只是个怪人。
-
“奇点”指的是机器智能超越人类智能的那一刻。到那时,机器将能够在无须人类帮助的情况下自我完善,其能力也将呈爆发生增长。
-
莱格在上学时就学会了自己制定规则,因此他也被戈策尔敢于打破常规的精神吸引。戈策尔对英国数学家艾伦·图灵提出的机器智能经典定义嗤之以鼻。图灵认为,当一个计算机程序能够成功伪装成人类时,就可以被视为具有智能。戈策尔反驳说,一个成功的“网络心智”永远不会达到这个标准。在诸如性体验这类话题上,它永远不会像人类,而且教它欣赏日落也毫无意义。“但这并不重要,”戈策尔继续说道,“我宁愿拥有一个知道自己是计算机、并能明智地谈论自身计算机属性的程序,也不想要一个能成功扮演病态说谎者、欺骗我们相信它是人类的程序。”
-
在赫特的指导下,莱格开始攻读博士学位。他汇集了多种可能的智能概念,并运用自己的数学知识来构建测量模型。后来,AI 的批评者常指责其创造者回避了这一挑战,即没有厘清智能与单纯的统计能力之间的区别。但菜格直面了这个难题。他最终确定的智能定义,既体现了戈策尔对图灵测试的否定,也融入了他给戈策尔的建议。AI 不应该以模仿人类的能力来衡量,因为人类不完善的认知能力并不能作为一个合理的基准。相反,智能的真正标志是通用性。莱格与赫特共同提出了一个总结性的表述:智能衡量的是一个主体在各种环境中实现目标的能力。
-
奇点峰会的组织者之一雷·库兹韦尔总结了人们面对超人类 AI 时的典型的情绪表现:惊叹、担忧,以及“除了继续前行别无选择”。这种震惊、恐惧,然后无奈接受的过程,类似于身患绝症的病人面临诊断结果时的处境:起初,他们考虑在剩余的时间里做一些激进的事情;接着,他们又恢复了往日的生活节奏,仿佛一切都没有改变。人类缺乏处理生存威胁的语言体系,无法想象那些难以想象的事情。他们的天性让他们相信生活将继续下去,否则他们就无法行动,生活也将变得无法继续。
-
要打造强大的 AI,他们需要一个团队、一种紧迫感,以及摆脱学术官僚主义的自由。
-
在塑造思想和改变社会方面,这个平台的影响力远远超过了苏菜曼以往所见过的任何事物。如果 Facebook 继续以同样的速度增长,它很快就会超过基督教在英国的影响力。思考着这些巨大的影响力,苏莱曼下定了决心。如果他真的渴望变革社会,他就应该成为一名技术创新者。
-
哈萨比斯构想的是一种将对世界产生巨大影响的技术,而苏莱曼则致力于探索世界需要怎样的改变。
第 5 章 创立 DeepMind:与彼得·蒂尔的命运交汇
-
哈萨比斯是风险投资家们所说的“真正的”创业者的极端例子:他不是那种一开始就渴望通过初创公司致富,然后四处寻找可行项目的唯利是图者,而是那种迫切想要应对某个特定挑战,然后创办公司来解决它的使命感驱动型企业家。使命感驱动型企业家的优点是永不放弃:即使他们必须夜以继日地工作,不拿任何薪水,也会一直专注于解决问题。
-
社会面临的最紧迫挑战的复杂性,已经超出了人类目前的能力范围。AGI 是解决这个问题的关键。
-
人脑由多个不同的部分组成,每个部分都有自己独特的解剖结构和算法能力。虽然这些组件单独来看都很强大,但人脑真正的神奇之处在于,各部分被深度整合在一起,从而产生了通用智能。
-
我说,我对哈萨比斯对故事的记忆力以及他将自己代入其中的能力印象深刻。“你看,我有着非常丰富的想象力,”哈萨比斯回答道,“这就是我博士阶段研究想象力的原因。我能想象人们处于各种情境中的样子,并能真切地体会到他们的感受。这是我天生就会做的事情。”
-
哈萨比斯与塔林保持着一定的距离,继续招募人才。到那时为止,他不仅仅是在招募人才,更是在打造一个能让人才蓬勃发展的平台。这涉及他从剑桥时期就一直在酝酿的想法:大多数创业项目的目标是将已知技术转化为产品,这是一个工程挑战;而像 DeepMind 这样的高科技初创公司,目标是发明技术本身,这是一个科学挑战。科学类初创公司比工程类初创公司更难、风险更高,因为你无法确定技术路径的可行性,正如在“阿波罗11号”登月之前,没有人能确定登月是否可行。但“阿波罗11号”登月成功后,模仿者便获得了登月可行的范式。而且,由于科学类初创公司正在开拓前沿领域,它们的员工配置和组织结构必须特殊:在工程类公司,你需要务实的问题解决者,他们会不惜一切代价打造出特定的产品;在科学类初创公司,你需要能在未知领域探索的天马行空的思考者——尽管你也需要以某种方式引导这些探索。
-
为了将这种博采众长的能力融入他的初创公司,哈萨比斯招募了一批项目经理,他们有时被称为“黏合剂式人物”,职责是滋养人才,弥补团队内社交方面的不足。才华横溢的研究人员可能无法进行行政协调工作,不善于口头沟通,甚至不敢与同事对视。而 DeepMind 将成为一个让这些缺点无关紧要的地方。
第 6 章 雅达利启示录:DeepMind 的智力革命
-
事实上,人类的许多学习都是通过试错完成的。孩子通过掉落的物体来了解重力;通过说“请”来得到自己想要的东西,从而学会礼貌。强化学习让机器也能做到这一点:在行动中认知,在交互中进化。
-
强化学习的所有这些元素都是为了实现一个目标:复杂环境中存在无数可能的行动,要通过试错来学习,系统需要知道哪些行动值得尝试。换句话说,要驾驭无限可能,无限机器必须开发出能缩小最佳行动搜索范围的算法。
-
姆尼赫意识到,打造 AGI 的抱负听起来可能有些狂妄,但它也有一个优势。根据他的经验,学术界的文化既枯燥保守又竞争激烈:枯燥是因为科学家们只追求渐进式进步,激烈是因为为了抢占首发权而互相倾轧。莱格和维尔斯特拉承诺会给他带来完全不同的体验——追求巨大突破的激动人心的过程,以及几乎没有竞争对手的环境。“他们说,是的,我们要做的事情没有竞争,因为没有人认这是可能的,”姆尼赫回忆道,“而且如果成功了,它的影响将是巨大的。”
-
我想起了那部激励哈萨比斯申请剑桥大学的电影《生命的故事》中的一句台词。DNA 双螺旋结构的共同发现者之一詹姆斯·沃森说:“我是信徒之一。那些在没有任何证据之前就选择相信某件事的人,是会有福报的。”
-
姆尼赫抵达伦敦时,DeepMind 这种跨学科的做法在某种程度上显得有些逆势而为。神经网络引发的热潮愈演愈烈:无须借鉴 AI 的其他分支,深度学习似乎就能在从医疗诊断到翻译等一系列方向上取得进展。但 DeepMind 坚持其跨学科的愿景。无论深度学习取得了多大进展,这种方法本质上只能构建将 A 与 B 相匹配的一种系统——语音转文本、图像转文本等。而 DeepMind 强调智能体和通用智能,追求的是更高级的目标:一个能够在多种环境中制订计划并实现目标的智能体。
-
将游戏经验存储在记忆缓冲区中,神经网络就可以随机抽取样本,避免“边学边用”模式导致的深度学习功能紊乱的现象。对西尔弗来说,记忆缓冲区是基于强化学习的理念;对哈萨比斯和 DeepMind 的神经科学家来说,缓冲区扮演着海马的角色;对姆尼赫和卡武克库奥卢来说,其目标是将相关的游戏经验转化为深度学习所需的随机教学材料。
-
记忆回放表明,AI 系统如果模仿海马和新皮质的交互模式,性能会更好。玩家网络与教练网络的区分则表明,将 AI 系统划分为独立的、类似人脑的不同区域,可以打造更强大的智能体。哈萨比斯的商业计划书曾承诺在受神经科学启发的 AI 领域取得根本性突破,3 年后,他兑现了承诺。
-
回顾这次胜利,西尔弗指出,自万灵药工作室失败的经历以来,哈萨比斯已经成长了许多。在这两个案例中,哈萨比斯都宣布了宏大的抱负,但在 DeepMind 的案例中,他还设计了通往目标的阶梯。在万灵药工作室,他让公司直接投入制作有史以来最复杂的电子游戏中,这种好高骛远导致了项目的失败。而在 DeepMind,虽然他的最终目标更加宏大,但哈萨比斯在组建科学团队的同时,允许员工进行探索,没有给他们设定苛刻的目标。一旦团队组建完成,哈萨比斯就展现出了卓越的判断力。通过选择雅达利游戏作为挑战对象,他把握住了融合深度学习和强化学习的最佳时机。结果他展现了又一个“ImageNet 时刻”——不仅针对视觉领域,也针对智能体领域。
第 7 章 DeepMind 争夺战:马斯克、帝尔、谷歌与未来的赌注
-
在哈萨比斯看来,真正的通用智能将让几乎一切成为可能,其重要性将超过互联网、印刷术,甚至工业革命。它将引领人类进入一个资源极大丰富的后稀缺时代,就像他青年时期读过的科幻小说中描述的未来那样。
-
哈萨比斯继续说道,他指的是那位 17 世纪的荷兰哲学家,“上帝存在于自然之中,所以理解自然是一种精神追求。爱因斯坦虽然不是传统意义上的宗教信徒,但他也认同这一观点。他说他信仰斯宾诺莎的上帝,我想他的意思和我一样。”
-
达·芬奇是我最喜欢的人,因为所有事物在他那里都融为一体,流向同一条河流。这也是我努力追求的生活方式,一切都浑然一体。
-
我朗读了一段哈萨比斯在我们之前的一次谈话中推荐的斯宾诺莎传记中的文字。这句话让我想起哈萨比斯追求科学使命时的执着:“对于斯宾诺莎来说,哲学不是武器,而是一种生活方式,一种神圣秩序,其追求者将获得至高无上且确定无疑的幸福。”“我完全同意这一点。”哈萨比斯插话道,“如果你问生活的真正意义是什么,我会认为是追求自我认知。”
-
显然,谷歌愿意为有雄心的项目投入几乎无限的资金,而 AI 正是它的优势领域。根据公司的一项非正式指导原则,只要某个软件项目有机会影响 10 亿用户,谷歌就会支持这种真正宏大的冒险。
第 8 章 锚定未来:携手谷歌,AI 之战一触即发
-
最终,出于对哈萨比斯的信任,谷歌放下了这些担忧。“如果我们不是绝对相信德米斯代表了谷歌 AI 战略的未来,我们绝不可能同意这样的交易结构。”哈里森后来表示。
“在我们进行的交易中,有一半都会面临 CEO 或创始人离职的情况。”哈里森继续说道,谷歌通常对此并不在意。但 DeepMind 的情况恰恰相反,谷歌想要这家公司,更想要哈萨比斯。
“作为并购顾问,我的职责就是提出,‘这是独特的,这是史无前例的,’”哈里森回忆道,“创始人拉里·佩奇和谢尔盖·布林一开始和我站在同一立场,对我提出的问题表示担忧。但最终他们站到了德米斯一边。所以,我要将此归功于德米斯,他清晰地阐述了一个愿景,说服了创始人们。”
第二部分 AI 霸主之争:OpenAI 与 DeepMind 的双雄竞逐
- 要真正理解人类知识的边界,我们必须借助自主的机器智能。
第 9 章 直觉之力:从 GEB 到 AlphaGo,哈萨比斯开始攻占人类最后的精神高地
-
要攻克围棋,机器必须像人类一样观察棋子的布局、棋子构成的定式,并凭直觉找出正确的做法——无论“直觉”究竟意味着什么。许多 AI 研究人员都认同布林的观点,人类某些难以捉摸的能力是计算机无法企及的,而直觉就是其中之一。
-
哈萨比斯有理由相信围棋能更快被攻克。这一切始于《哥德尔、艾舍尔、巴赫》所揭示的核心思想:“人类大脑能做到的事情,计算机也应该能做到。”直觉或“系统一” 思维听起来难以言喻、无法被编程实现,但自剑桥大学求学时期起,哈萨比斯相信,智能的所有表现形式归根结底都是在海量杂乱的信息中识别模式。直觉本质上是某种巧妙的算法——一种科学能够揭示的算法。
-
提升带来了显著的性能改进。麦迪逊的网络预测专家走法的正确率不再是 1/3,而是略高于 1/2。它仅通过观察行棋局面,甚至无须进行树搜索,就能接近世界上最优秀的围棋系统的水平了,达到了人类实力强劲的业余强手的水准。这个结果证实了《哥德尔、艾舍尔、巴赫》中的核心观点:人类的直觉并非那么神奇,机器通过将一种事物映射到另一种事物的技巧,就能重现这种能力。
-
西尔弗同意扩大神经网络规模可能会带来显著进展。他的博士导师理查德·萨顿曾谈到过 AI 的“惨痛教训”:科学家们总是急于设计出精妙的算法,但事实是,保持算法简单并提供更多计算能力,往往能取得更好的效果。同时,西尔弗认为,规模扩大带来的优势不仅限于神经网络。他告诉苏茨克维,规模扩大也会改进蒙特卡洛树搜索。
-
“做开创性的事情是非常困难的,”哈萨比斯后来回忆道,“你有一种道德责任,需要充分利用自己的创造性成就,从而获得资源以继续开展下一个项目。”
-
AlphaGO 的出现,终结了 AI 领域默默无闻、谦逊低调的纯真时代。
-
“没错,”格雷佩尔点了点头,“就是这样!堪称魔法。当然,这并不是魔法,而是算法的先见之明。只是在低等智能看来,它才像魔法。”“这就是我们必须想象的未来。在围棋领域,我们已经实现了超级智能,我们可以体验与它互动的感受。一开始,它看起来毫无威胁。然后它的用途完全占据了主导地位。我们不理解它的运作机制、战术和策略,我们只知道,控制权在它手中。”
第 10 章 逐出伊甸园:OpenAI 在 AI 巨头博弈中横空出世
-
佩奇用沙哑的声音告诉马斯克不必担心。他说,他期待有一天人类能与智能机器融合,或者机器干脆取代人类。进化将确保最优秀的智能形式胜出,如果这种最优形式是高速硅电路而非慢速生物组织也无妨。对这类事情伤感毫无意义,因为这是大自然的生存法则。
佩奇表达的观点已经存在超过了半个世纪。1964 年,科幻作家阿瑟·C.克拉克(Arthur C. Clarke)称,“人类成为通往更高阶事物的垫脚石,这是一种特权。”“我怀疑有机生命的进化或生物进化差不多已近乎走到尽头,我们正处于无机生命的进化或机械进化的开端,而这一过程将比过去的变化快数千倍。”
-
和大多数 AI 先驱一样,哈萨比斯希望通过统一的科学攻坚推动这项技术发展。2010 年他参加奇点峰会时,全球大部分 AI 信仰者都能挤在一个会议厅里,形成一个团结的 AI 社群。无论在旧金山还是其他地方,任何向这个社群发声的人,都是在呼吁所有“信徒”认同一个愿景,这个愿景往往包括 AGI 的构建理论以及守护这项技术的号召。尽管不同人的愿景可能存在细微差异,但“信徒”们都惧怕圈子分裂。无论哪种 AI 愿景最终胜出,单一愿景都比多种愿景并存更好。如果众多实验室争相将这项技术推向世界,争当第一的竞赛将让人们把安全层面的顾虑抛诸脑后。
-
苏菜曼坚持自己的观点,认为 AGI 与谷歌高管们赖以乐观的以往创新不同。过去,文字处理器、数字数据库和在线搜索只是接管了特定任务,在大多数情况下,它们并未完全取代人类以完成工作。然而,未来机器将具备思考能力,获得完成“工作” 而非仅仅是“任务”的通用性。更重要的是,它们不仅能超越人类完成如今已有的工作,还能胜任未来可能出现的新工作。AGI 是一项通用技术,其对人类存在意义的影响广泛到令人担忧。
第 11 章 医院里的 AI 革命:DeepMind 破解智能的最高优先级
-
保护患者隐私固然重要,但也需要权衡利弊。你可以通过不共享数据来确保患者个人数据的绝对保密,但这样一来,你也就放弃了为患者改善健康状况的机会。
-
透明即信任,信任即正直。
第 12 章 从 Transformer 到 GPT:OpenAI 强势崛起
-
西尔弗在强化学习方面的非凡造诣证明,国际象棋远未被破解—还差得很远。人类从未意识到自己所知甚少,无限机器可能开辟新的知识视野。在训练初期,AlphaZero 采用了与人类职业棋手相同的开局序列,但它很快发现了其中一些常规走法的缺陷。它先是摒弃了这些走法,然后自创了更好的走法。AI 对人类数百年的智慧进行了评判,印证了部分结论,也推翻了一些。
-
AI 专家们早就认识到,人类能瞬间、不假思索完成的任务(如识别图像)很难被编程来实现,因为人类自己都没有意识到完成这些任务所需要的具体步骤:这就是著名的莫拉维克悖论(Moravec’s paradox)。与此同时,人类需要缓慢、有意识且付出巨大努力才能完成的任务,在传统上被认为更容易通过编程来实现:一个简单的便携式计算器就能计算任何数字的平方根。“35 年 AI 研究的主要教训是,难题其实很容易,容易的问题反而很难。”认知心理学家史蒂芬 ·平克(Steven Pinker)在 20 世纪 90 年代中期曾有过这样著名的观察。
然而,多亏了戴维·西尔弗,DeepMind 两次修正了莫拉维克悖论。第一次修正是 AIphaGo 模仿人类直觉,表明一个看似不可能的编程挑战实际上是可以解决的。第二次修正是 AlphaZero 的出现,它证明了人类需要有意识、费力气才能下的棋(因此人类认为自己可以通过编程实现),实际上并未被彻底破解。无数国际象棋专家曾将国际象棋知识手动编码到 Stockfish 系统中,但他们的成果始终存在局限,而西尔弗的自主系统表现则出色得多。哈萨比斯总结道,这表明,无意识的知识比想象中更容易被编程,而有意识的知识则比想象中更不可靠。那些我们自以为已知的事物,最终可能被证明是未知的。要真正理解人类知识的边界,我们必须借助自主的机器智能。
-
问题在于,AlphaZero 的意义不仅关乎人类及其认知局限,更关乎通往 AGI 的道路。对西尔弗来说,这次强化学习的突破标志着一场革命。AlphaZero 从零开始,在没有人类指导或人类数据的情况下,精通了 3 种不同的复杂游戏。AI 面临的古老障碍——无法设计出一个演绎系统来分类和解释世界,被成功绕过;归纳问题——在海量数据中寻找规律的挑战,也被攻克。像 AlphaZero 这样的强化学习系统,有望攻克各种复杂的现实世界的挑战。西尔弗评论道:“我们不再受限于具有预定义规则的系统。”
-
卷积神经网络专为解读图像设计,利用的是空间相关性——相邻的像素群能为图像某一部分(如猫的眼睛)提供线索。而 Transformer 模型理解的是时间相关性:信息序列会随着时间展开,网络需要理解每个短语或剧情转折与其他部分的关联。
-
谷歌具有革命性的 Transformer 论文的核心见解是,注意力机制比线性分析更能解锁序列的含义。
-
如果你已从各个角度反复思考过一个问题,那么当正确的解决方案出现时,你会立刻认出它。
-
“打造 AGI 将是一个庞大的项目,因此工程学必然是核心,”苏茨克维解释道,“对我来说,这是 OpenAI 的核心理念之一:要以前所未有的方式尊重工程学。为什么这一理念如此具有革命性?因为 AI 起源于学术界,而学术界的人往往看不起工程学的烦琐工作。”
这确实是事实,也恰如其分地描述了 DeepMind 的情况。哈萨比斯和他的同事们贬低 OpenAI 的工作是以工程学为主导,只有蛮力,没有智能。他们发表《自然》论文,而 OpenAI 只能发布博客文章。
“在 OpenAI,我们有一个信念:不要太聪明,”苏获克维说,“我们拥有的技术非常强大,已经足够惊人,我们只需要去实现它!这是谷歌和 DeepMind所缺乏的,也是我们的优势。”
-
“这确实基于统计规律!但统计的本质是什么?”“为了理解这些统计数据,为了压缩它们,你需要理解是什么样的世界产生了这些统计数据,是什么样的人类行为导致了这些统计数据。人类有思想、有情感和想法,他们会以特定的方式行事。所有这些都可以通过预测下一个词元来推导出来。”苏茨克维的意思是,如果计算机能理解人类如何选择句子中的下一个单词,它们就能掌握人类思维的内部运作机制。
第 13 章 语言与自然之道的背离:第一次惜败 OpenAI
-
“神经科学中有一个分支叫作“知觉行动论’,该理论认为,从某种深层意义上来说,除非你在世界中行动,否则无法真正感知这个世界。重量就是这样一种你无法仅凭阅读就能理解的东西。我大致知道拿起这个杯子会是什么感觉,但如果我从未拿起过任何东西,又怎么能想象这种触感呢?”
-
“这就是我们所说的‘接地问题’。这是我第一个判断失误的地方。现在我意识到,语言的内在接地性比我们想象的更强。”哈萨比斯解释说,互联网上有太多关于狗腿的描述,机器完全可以借此初步理解狗腿的样子。将现实映射到符号的能力,或许会像 2017 年 OpenAI 模型中的“情感神经元”那样自然涌现,而人类反馈的微调更让这种涌现成为可能。“实际上,语言模型是在向我们学习如何接地。”哈萨比斯反思道。
第 14 章 马里奥计划:从阿西洛马到谷歌总部的隐秘博弈
-
AI 最终需要某种获得民主广泛认可的非营利监督机制,因为政客们对尖端技术的理解向来迟缓。
-
哈萨比斯和苏菜曼并不知道,彼时的 OpenAI 也经历了一场类似的斗争。到 2017 年夏天,这家初创公司的领导层意识到,他们需要的资金远超非营利组织能筹到的款项,于是开始讨论加入营利性结构。这与 DeepMind 的困境形成了镜像:DeepMind 是营利性公司,但希望为强大的 AI 搭建非营利治理框架;OpenAI 是非营利组织,但需要借助资本机制募资。双方都认为,资本主义与后资本主义的混合模式是出路。
-
在 Alphabet 董事会会议上,谢尔盖·布林严厉地批评了苏菜曼。他说,委员会的行为是可以预见的。如果你给外部人士一个平台,他们就会为自己的目的所用:为自己的职业生涯镀金,增强自己的声誉。无论谷歌的项目多么有益,都不会是他们优先关注的。
-
哈萨比斯喜欢说,世界上最糟糕的事情就是控制别人。他的这种坚持是真诚的:与一些沉迷于名利或权力的领导者不同,哈萨比斯并不享受支配他人的感觉。他对支配的厌恶也指向自身:他绝不允许被他人支配。苏莱曼多次挑战哈萨比斯对 DeepMind 发展方向的控制,越过了领导者的红线。DeepMind 是哈萨比斯创造的,是他的身份象征。
-
“安全不在于治理架构,”他继续说道,“我的意思是,即便有治理董事会,关键时刻它也可能不会做出正确的选择。安全章程也是如此。你可以尝试协商制定,但提前多年就制定明确的原则并不现实,因为你很可能把线画错了地方。”“所以讨论这些事情并没有什么用,”哈萨比斯继续说道,“这会让建立有效的信任变得更难,因为当你协商无须信任背书的架构时,就意味着你不信任对方。然后我想,为什么不反其道而行之?把用于无须信任谈判的精力投人建立真正有效的信任上。尝试融入谷歌,而不是与之疏远。”
-
“我想对我来说,或许对苏莱曼来说也是如此,这关乎我们的成长,”哈萨比斯沉思后说道,“我们经历了那些谈判,逐渐成熟。事情并不是非黑即白,尤其是当你面对一项后果未知的技术时。所以你必须学会适应,从理想主义者转变为现实主义者,但仍然希望保持理想主义的内核。”
-
但哈萨比斯是对的,他年轻时的理想确实不切实际。像 AI 这样具有变革性的技术,永远不可能是单一实体努力的产物。一旦多个国家的多个实验室加入争夺强大 AI 的竞赛,就无法阻止它在民用和军事领域的部署。一个心怀善意的人能参与决策,这给忧心忡仲的世界带来的安慰是脆弱的,但或许已是当下最好的慰藉了。
第三部分 超越极限:哈萨比斯如何在智能竞赛中击败世界
第 15 章 生物学届的费马大定理:AlphaFold 主力哈萨比斯问鼎生命科学巅峰
-
对江珀来说,能给出答案的不透明模型,比无法给出答案的透明模型更好:毕竟,揭秘蛋白质折叠最终是为了推进医学发展、拯救生命,而不仅仅是解开一个智力谜题。此外,从物理方程转向更高层次、更模糊的抽象形式,或许正是生命科学研究所需要做的:生物学可能过于复杂,且具有涌现性,无法用简洁的数学语言来描述。事实上,这正是哈萨比斯的观点。自在剑桥大学求学起,哈萨比斯就相信,借助 AI 才能洞察支配生命的隐藏模式。试图通过物理学公理来理解生物学问题是一条死胡同—就像 AI 先驱们试图仅用逻辑规则打造智能机器一样,终究是徒劳无功。
-
在竟赛难度最高的“自由建模”项目(预测没有已知进化模板的结构)的 43 个案例中,AlphaFold 对 25 个结构的预测最为准确;而紧随其后的竞争对手只在 3 个案例中排名第一。其他科学团队都感到敬畏:“我们这些立志让晶体学家失业的人,现在开始担心自己即将被淘汰。”一位参会者写道。“刚刚发生了什么”成了会上所有人都在问的问题。答案是,哈萨比斯上大学时的信念被证明是正确的。要理解生物学,需要的不仅仅是生物学智慧。
-
一个神经网络可能会完成一项有限的任务,比如猜测被隐藏的词元,但其更广泛的能力会随之涌现:智能。
第 16 章 权力与荣耀:坚持做超级智能的终极守门人
-
尽管 AI 领导者有时会通过设计新颖的治理架构来应对这些危机,但欧文和他的同事们有不同的理解。AI 的安全属性应该在机器设计之初便植入内核,这是一个技术挑战,而不仅仅是政治或伦理问题。
-
哈萨比斯想知道,一个没有接地的模型能否为真正重要的事情,比如理论物理的进步做出贡献。欧文给出了回答:20 世纪最伟大的发现当属爱因斯坦的广义相对论。而爱因斯坦所做的只是阅读资料、做简单笔记、进行思想实验,这些都没有所谓的“接地”。此外,如果语言模型能够完成大多数认知任务,它们就有可能为在物理世界中行动的机器人提供动力,因此语言可能是 AI 实现真正接地的途径。
-
如果说哈萨比斯是一个逆势而为的独行者,热爱伦敦,那么奥尔特曼则处于一个强大网络的中心,这个网络连接着人才、资本和流量,一切都为创造新的未来服务。尽管哈萨比斯更早地想象出了一个拥有强大 AI 的世界,但奥尔特曼同样能令人信服地描绘出一个新的未来。
-
少样本提示语可能会成为骗子的工具。你将几个文本句子输入模型的对话框,系统就会模仿作者的风格,它不仅会生成文本,还会生成一个角色。
-
探索的果实是甜美诱人的,发明者不可避免地会被权力和荣耀所吸引。
第 17 章 竞赛 GPT:Gemini 重新定义 AI 大战格局
-
OpenAI 的成立前提,以及 DeepMind 与谷歌的治理谈判逻辑,都过于简单了。认为逐利的公司总是会不负责任地加速部署技术这种想法并不总是正确的。
-
自 OpenAI 成立以来,奥尔特曼就知道,成功的人创建公司,真正成功的人创建信仰。
第 18 章 “我们要完了”:科学家的警告与一往无前的 AI
-
“所以 AI 必须能感受到类似痛苦的东西,这样当敌人试图伤害它们时,它们才会做出反应。如果 AI 有自我保护的欲望,还能感受到痛苦,那就非常接近拥有自身意志了。如果 AI 想要进行自我防御,它们会意识到,变得更聪明就能更擅长抵御网络攻击。所以到时候,它们会想要控制数据中心。”辛顿停顿了一下,退出辩论模式,语气开始变得柔和而深沉,他说:“几年前,我对这些并不感兴趣。当时我们只是想着继续打造这些东西,之后再担心安全问题。”
-
大多数 AI 圈内人士,尤其是 3 大 AI 前沿实验室的大多数人,都不相信“世界末日的概率”为 0。AI 正逐渐变得比人类更聪明:一般来说,更高级的智能会主导更低级的智能。
-
但问题在于,“对齐”本身是一个移动靶。随着AI 模型变得更聪明、更有自主能动性,人类需要研发出新的后训练优化方式;科学家无法确定,未来强大的 AI 模型是否一定能被设计成遵从人类意愿的系统。此外,历史已经证明,人类有过度相信技术解决方案的倾向。
-
政府是 ChatGPT 产生影响力的另一个领域。自 DeepMind 成立以来,哈萨比斯从多个角度探讨过 AI 安全问题,但他从未思考过政府在其中能扮演的重要角色:强大的 AI 还太遥远,无法吸引政界的关注。现在,由于 ChatGPT 的冲击,政府已经准备好介人。事实上,作为唯一能够超越技术竞赛、创新者困境和探索乐趣的重要力量,政府在 AI 安全上将发挥至关重要的作用。
第 19 章 步步为营:从 Gemini 到 OpenAI o1 的较量
-
对话框的突破反映了 DeepMind 长期以来的关注点。自博士阶段研究想象力和记忆以来,哈萨比斯就一直强调智能需要多种类型的记忆,如长期记忆与短期记忆、情景记忆(用于回忆事件)与语义记忆(用于回忆事实或概念)。一种被称为“工作记忆”的特定记忆类型,对问题解决和学习至关重要,它能让人们在脑海中同步处理复杂论证的多个步骤,从而进行有效推理。前额叶皮质是工作记忆的功能区,该区域受损的患者会表现出工作记忆受损的症状。健康人能同时记住 7 个数字,而这类患者只能记住一两个数字,而且无法解决简单的数学题,这并非因为他们无法思考,而是因为他们无法记住思考所需的信息碎片。DeepMind 打造巨大对话框的目的就是为 Gemini 配备等同于人类工作记忆的机器版。如此一来,Gemini 能同时处理的上下文越庞大,对用户的回应就越精准。
-
显而易见的答案是承认数据确实稀缺,并教会模型从每个信息单元中挖掘更多知识。人们具有强烈直觉,认为这应该可行。在语言模型的预训练过程中,会瞬间扫描一些极其丰富的资源,如教科书、学术论文,那 AI 为何不能像人类一样,反复阅读文本、深入思考、推敲其含义?想必 AI 系统思考得越深入,其所需的数据就越少,这一见解将研究人员带回了强化学习领域。深度思考,正是 AlphaGo 和 AlphaZero 采用的核心机制,它们不断推演棋路,评估局势、回溯及展开更深层的探索——这一过程被西尔弗和哈萨比斯称为“深度内省”。而这种规划与搜索的本质,即强化学习,必将成为突破数据限制的解决关键。
-
一年后,谷歌 DeepMind 的研究人员打造了更接近 AlphaZero 的系统。他们不再让模型模仿可能存在缺陷的人类推理,而是让模型通过观察哪些步骤能导向客观、正确的答案,自行识别优质推理步骤。正如西尔弗经常强调的那样,最优秀的强化学习系统的奖励机制并非来自人类的主观选择,而是来自客观事实:在围棋对弈中,走法决定胜负;而对于推理模型,推理步骤决定数学或逻辑问题的答案是否正确。
-
但 o1 带来的最大启示在于规模化扩张。和谷歌 DeepMind 的实验人员一样,OpenAI 的研究人员也为他们的推理模型提供了思维词元。他们发现,随着思维词元分配的增加,即允许模型在测试阶段进行更多计算,其推理能力会稳步提升。事情本不应如此:增加思维词元本可能会带来边际效益递减。但就在 AI 悲观主义者由于数据墻预测进步即将终结时,OpenAI 用事实证明他们错了。实验室开创了一种全新的性能提升方式:通过增加测试阶段的计算量来获得更强的智能。
第 20 章 Flash Thinking、DeepSeek 强势登场:超级智能时代呼啸而来
-
突击小组的进展还得益于另一个要素—筹备会议上那页幻灯片足以说明,只要组织得当,成功会不期而至。正如哈萨比斯在描述加力推进 AlphaFold 时所说,当创意源源不断涌现时,正是奋力向前之时。
-
“我现在最常说的一个词就是‘坚持不懈’。坚持不懈地进步、坚持不懈地交付,以及坚持不懈地运作一台为创新而生的量产机器。”
-
总而言之,与哈萨比斯的期望相反,DeepSeek 及其追随者的出现表明,人类将在完全无序的情况下仓促迈入 AGI 时代。
-
当然,每一次令人不安的实验室经历都能带来有益启示。就刻意掩藏的“隐藏奖励黑客”而言,教训很简单:若你想让思维链真实反映模型的真实思考,就不应将其与奖励机制挂钩。但与此同时,模型反复欺骗的行为表明,对齐问题远未解决。正如杰弗里·欧文长期强调的,理论上可通过工程手段为系统植人安全机制,但现有进展仍远远不够。
-
人类应该拥有获得 AI 协助的新权利。若所有人都能享有这项权利,每个人都会得到强大自主 AI 提供的支持,这些 AI 将协同运作,共同守护地球上的人类,而且它们必将比当前的人类系统做得好得多。“这样的未来值得我们为之奋斗,而这正是我想要跨越这道界线的原因。”
后记 图灵的使命之眼与深度之心:我们仍在创造无限可能
-
正如哈萨比斯最初告诉我的那样,推动科学进步就是揭开自然的秘密,从而更接近某种意义上的“神性”。
-
“当然了,我在很多事情上都会坚持我的观点,尤其是关乎使命的事,”哈萨比斯继续说道,“我会努力倾听新的论据,如果论证充分,我会改变自己的立场。但我改变立场的门槛很高,因为很多问题我早就深思熟虑过了。而且,越是接近核心使命的问题,我就越会用下围棋的思维反复推敲。”“所以,我不否认自己可能很固执,甚至难以相处。但我认这是必要的。如果我像风中的芦苇一样摇摆不定,就是作为领导者的失职。”
-
“但你要知道,权力本身对我毫无吸引力,”哈萨比斯继续说道,“我想那些痴迷权力的人,比如世界上的独裁者,他们倾向于让别人感到渺小或伟大,随意决定他人的命运,像凯撒那样掌控生杀大权。但这不是我理解的乐趣。这就是我说自己不想控制或操纵别人的原因。”“而且,如果我真的在乎权力本身,那我当初就不会卖掉公司了。现在,我其实已经不再完全掌控公司了,说不准哪天就会被解雇。如果我像山姆、马斯克、扎克伯格或拉里·佩奇那样经营公司,才真正不会被解雇。很多人创办公司,就是为了这种掌控感。但我创办 DeepMind,只是因为我认这是推动使命落地的最佳方式。如果留在学术界,我根本得不到足够的资源。”“而且说到底,AGI 最终应该无偿馈赠给世界。我的意思是,AGI 的意义远超一家公司、一个人或一群所有者。它比资本主义体系、国家经济都更宏大,实际上,它关乎全人类。“它是全人类的发明,也将影响全人类。所以,它理应由全人类共同管理。但问题在于,什么样的机构才是合适的管理者?在找到答案之前,我确实需要一定的权力,至少是必要的权力。”“这就像对待钱的态度一样,我一点也不在乎钱本身,但我仍然需要有一定的钱。”
-
他的核心主题:财富和权力本身并非目的,而是获取科学和知识的手段。
-
“自然界中任何可生成或存在的模式,都能被经典学习算法高效地发现并建模。”哈萨比斯曾在诺贝尔奖颁奖典礼上宣称。从表面上看,这似乎是代表 AI 领域的常规断言,毕竟无限机器的本质就是识别模式。但仔细分析就会发现,这句话将 DeepMind 的计算进展与一套宏大的宇宙理论联系了起来:这套理论认为,AI 不仅是探索知识的工具,更是解开世界深层奥秘的组成部分。仔细思考哈萨比斯这番话的全部含义,就会明白他对 AGI 长达 15 年的追求—始于疯狂,终于敬畏,其实有其合理性。