演讲者:弗兰克·维尔泽克(Frank Wilczek)
出品:新浪科技《科学大家》 墨子沙龙
作者简介
弗兰克·维尔泽克(Frank Wilczek):理论物理学家,麻省理工学院物理学讲席教授,诺贝尔物理学奖获得者。
大家好,很高兴来到这里,继续我在中国做公开演讲的传统。看到科学在中国的被关注程度,以及中国科研的活力,不断提升的科研质量,很令人鼓舞。
今天的主题不仅是目前物理学前沿的大问题,也是哲学前沿的大问题:理解意识是如何从物质中产生的。
大多数科学家,如研究人类大脑的神经生物学家,都假设意识确实是从物质中产生的。因此,全面理解了大脑也将使我们明白人类是如何思考的。但是,在物理学中,我们也逐渐明白,信息应该被视为是物理的( information is physical)。贯穿这次讲座,我将对这一想法详细论述,并且它可以以几种完全不同的方式体现出来。信息和思想不仅可以在大脑物质中实现,也可以在其他种类的物质,甚至与人类大脑不太相似的物质中实现。所有这些都表明,意识可以从物质中涌现,而且是以几种截然不同的形式。这就是为什么我今天的标题是“奇特新脑(Strange New Minds)”。
我将要讨论的第一种奇特新脑是大家可能都熟悉的东西。这是下面我将谈论的技术中最为成熟的一个,但是它带来了这样一种观点,即意识能够以一种现在人们非常熟悉的、切实的形式,从物质中涌现出来。数字计算机,我们知道它们所做的一切——在许多方面类似于智能实体的行为,都是基于对大量0和1的操作。我们确切地知道这些奇特新脑是如何工作的,因为是我们建立了它们。
乔治·布尔(George Boole)
信息可以通过符号来表示,一般意义上的信息都能够以0和1来表示。这一理解可以追溯至乔治·布尔(George Boole),他是19世纪英国的一位数学家和哲学家。他写了一本著名的书,题目是“思维的法则”(Laws of Thought)。在哲学家莱布尼茨甚至亚里士多德那里,你能发现更早的类似想法,但是把它引入科学层次的确实是布尔。布尔的核心想法可以简单地这样表述:思维中的一个过程、理性的一个过程,是逻辑演绎。布尔认为,我们可以用“1”来表示一个陈述为“真”(正确),用“0”来表示一个陈述为“假”(错误),然后就可以依据系统的法则,对这些“0”和“1”进行操作,得到新的推论、新的陈述。
例如,如果陈述A是真的,那么以“1”来表示,陈述B也是真的,也以“1”表示,那么,陈述“A且B”也是真的,所以也应该以“1”表示。陈述“A或B”也是真的,因此同样以“1”表示。陈述“非A”是假的,因此以“0”表示。联合“0”和“1”来进行逻辑演绎的规则,叫作“布尔代数”。
布尔代数
受此启发,也受工业对实用计算技术需求的刺激,查尔斯·巴贝奇(Charles Babbage)设计了一个更通用的机器,他称之为“分析机”(Analytical Engine)。阿达·洛芙莱斯(Ada Lovelace)与他合作密切。在某种程度上,阿达·洛芙莱斯是第一位计算机程序员,她看到了这一机器的各种可能性,并将其解释给世界。
查尔斯·巴贝奇
阿达·洛芙莱斯
这是“分析机”的模型,它将“信息是物理的”这一想法,从概念阶段、从乔治·布尔意思到的符号表示阶段,发展到机械操作阶段。这台机器不同部件的设置,几乎没有来回切换的开关。这台机器通过机械操作来执行逻辑法则,或者你可以说,来实现思考。
分析机
艾伦·图灵(Alan Turing)继承了洛夫莱斯和巴贝奇在这个特殊的机器(按照今天的标准,这个机器又小又难用)中发展出的想法,并使它更加抽象了。图灵试图“捕获”所有的思想形式,不仅仅是数学计算或逻辑推理。在运算方面人们可以想到的一切,都可以用“0”和“1”来凝练地实现。例如,你可以用“0”和“1”来编码一幅图像:用一个二进制数来描述光的强度,这个二进制数有很多0和1;然后,操纵“0”和“1”可以生成不同颜色和光强的新图像。或者你也可以处理文本,以及实现很多超越布尔和洛夫莱斯所设想的逻辑和数学计算的事情。
艾伦·图灵
这里需要强调的一点是,尽管图灵的架构只是“符号式”的,他是一个理论家,但这个架构非常清晰。这台被称作“图灵机”的思想机器的每一步操作都非常清楚。因此,如果你想建造一台能“思考”的机器,你可以把它当作说明书来读。
图灵机:一种通用计算机
非常重要的是,图灵提出了令人信服的论据。其他人也从不同的角度探究这一问题,虽然他们提出的执行“思考”的方案很不同,但所有这些方案都被证明可以用图灵机来实现。因此,人们普遍接受了:任何能完成图灵提出的操作的机器,只要其足够快、规模足够大,就能做任何大脑能做的事情。这被称为通用计算机。
存在一种通用的具有思考能力的机器,这是一个非常、非常强大的概念。但是我想强调一个非常重要的物理问题,也是一个非常重要的哲学问题,也许喜欢挑战权威和质疑公认智慧的年轻人可能会提出这种问题,即:任何可以计算的东西,任何可以思考的东西,任何可以在物理世界中实现的东西,真的都可以用图灵机来计算吗?
这是一个深刻的物理问题。我们不知道确切答案。
克劳德·香农
克劳德·香农(Claude Shannon)是麻省理工学院的教授,他把故事推动到下一阶段。
当香农进行设计来实现布尔和图灵曾想实现的想法时,不是以机械齿轮和曲柄,或者纯粹的符号来实现,而是用更现代化的电子电路技术,我们称之为“逻辑门”。它们是逻辑运算的实现,我在讲到布尔时告诉过你们,但是现在它是以电路的输入和输出来实现的。
在一个非常常见的实验中,“真”以高电压表示,“假”以低电压表示。你在“(逻辑)门”的一端输入(高/低)两电压,经由一个合理设计的电路,通往另一端,在那里输出对输入进行布尔代数运算后的结果。如果你想表示逻辑“和”,也就是要实现:当且仅当两个输入都是高电压时,你的输出是高电压。这成为了设计电路来物理上实现布尔代数的一个问题。实际的电路相当复杂,如果你学习电子工程、计算机科学课程,你就会学习如何设计这些电路。
逻辑门
香农的博士论文就是基于能够实际制作出执行这些操作的电路设计。看这个例子,这是一个表示“否”的逻辑电路。如果你在左面的输入端输入一个高电压,那么低电压从右边的输出端输出,而如果你在输入端输入一个低电压,那么高电压则会从输出端输出。
电子逻辑门“否”
在早期,我指的是20世纪40年代开始的时期,实际上,这些想法是出于战争的需求而第一次被整合实现。在晶体管带来变革之前,计算机基于真空电子管。在我小时候,我父亲是一名电子技师,处理早期的收音机和电视,家里到处是这种真空管,就这样我慢慢开始了解和喜欢上它们。
真空管
但是,正如你所看到的,按照现代标准,真空管的体积太大了。与现代计算机芯片相比,真空管要大得多,而且这只代表一个逻辑门的一个元件。同样,它们并不稳定,发热现象很严重。但第一台电子计算机就是基于真空管发明的。
现代计算机时代真正开始于晶体管和集成电路的发现,利用它们你可以在一个小地方放置很多很多逻辑门。到了20世纪70年代,IBM生产出著名的360系统,虽然体积仍然很大,但却是基于晶体管、更复杂的电子学,磁带用作存储器。稍后,我会更详细些说明。多年来,这是一项占主导地位且非常实用的技术。
早期的集成电路和存储器
如今,曾经一房间仪器才可以实现的功能可以在一个芯片上实现。这个芯片可能只有拇指这么大。英特尔处理器就这么一点点。可以看到,由于物理学和工程学的进步,现在可以在一个很小的物体里实现很多很多的逻辑门,就是它们为你的苹果手机、笔记本电脑提供动力,从而让这些现代计算设备和许多工业应用在日常生活中变得如此简单。
现代处理器
这么了不起的装置,值得我们进一步去了解一下它。这里提供几个数据,这些是芯片的规格。首先是时钟频率。要进行逻辑运算,你必须完成一步,再做下一步,然后再做下一步。这是时间的函数,计算会随时间向前推进。时钟频率是每秒30亿次运算,记作3 GHz。信息移动的速度类似于每秒十亿次信息从一个地方传输到另一个地方。我可能没法向大家精确地说明这一定义,需要知道的是,这些思维机器非常敏捷。人脑的时钟频率大约是每秒1000次,要慢100万倍。而一台电脑的价格只有999美元,比雇一个学生或助手来做计算,成本要低得多。
芯片的规格
但是有两件事限制了这项技术继续发展。一是它产生大量热量。一个小小的芯片能产生高达130瓦的功率,这取决于你使用它的程度。而人脑可产生大约30瓦的功率,尽管它比人脑小得多,但它产生的能量和热量却比人脑多。计算机技术前沿的一个巨大挑战是散热。
芯片单元也变得越来越小。45纳米这一规格,可能对你来说太抽象了,它只有原子大小的几倍——大约是单个原子的十倍。所以,芯片运作背后的这些小逻辑门并不比单个原子大多少。芯片惊人的能力依赖于这些奇特的新“脑”,依赖于对物质如何工作的强大理解。所以说,物理很伟大。
要走得更远,我们需要更深入地了解物质是如何工作的。因为越小意味着越快、越便宜。我们制造越来越小芯片的技术推动了技术进步。这在哲学上非常有趣。你制造机器,制造出的机器再制造更小的机器。
但事实远比此更为复杂。同样,它需要许多基础物理创新和深刻理解。这就是万物的本质,沿着这条路,多年来进展显著,至少有50年的发展史了。
摩尔定律正发挥着作用。摩尔定律并不是一个定律,它不是自然定律,而是对数字计算机技术发展趋势的观察。这一定律概述:大约每两年,芯片的线性尺寸将变小一倍,价格便宜一倍,速度快一倍。这一业态已持续了几十年。
现在,翻一倍也许不像以前那样了。由于基本的物理原因,这种进展速度将很难保持。现在的比特几乎总是涉及:分离电荷以获得电压,正如我之前提到的,或者排列物体(通常是电子)的自旋。因此,如果你想编码“1”和“0”(这通常利用电压来实现),你要做的是这样分离电荷:如果高压开启,即正电荷在上而负电荷在下,你会得到“1”;相反,你会得到“0”。这是在物理上实现“1”和“0”的一种方法。或者,你可以利用自旋方向:自旋全部向上、向下分别代表“1”和“0”。
如今,尺寸越来越小,小到只有几个原子大小,因此,在“0”和“1”的基本实现上,我们可以利用的仅有几个单元。如果我们想继续改进技术,那将要改变摩尔定律,以及改变我们工作的本质,这是非常具有挑战性的,因为当我们进入只有一到几个自旋或电荷的层次,规则变化了。我们进入所谓的量子力学领域,面对的是物理学中的量子行为。
量子世界是一个很难开展工作的地方,在那里你只有一个电荷或一个自旋。数量上发生很小的涨落,就会导致完全不同的结果。而在量子世界中,涨落无处不在。
量子力学的本质在于概率,而且量子世界充满了涨落。例如,电子不能同时具有确定的位置和确定的速度,这就是海森堡不确定性原理。所以,当你的单元在到处移动并且很难确定的时候,这是一个很难开展工作的地方。
但正如我将要阐述的,这个奇怪的量子世界也充满了希望和允诺。如果我们与之合作,而不是试图与之对抗,它会开辟新的可能性。
我们正在从比特、二进制数字,即1和0,转向量子力学版本的比特,称之为量子比特。这带来了一种新的信息,不是布尔、巴贝奇和图灵等认为的固定量的0和1,而是物理世界启发的、来自物理世界的——涨落的量。
经典比特和量子比特
最简单的两态系统即一个单自旋,就是一个量子比特,它和我已经提到的经典世界的指上或指下的东西具有非常不同的图像。它具有量子不确定性。由于我们无法摆脱量子不确定性,我们必须学会接受它。
就这种不确定性的特别形式,我详细解释一下。现在我们测量一个量子比特的自旋——让我们把量子比特看作是指向上或下的自旋。我们可以在任意方向测量这个量子比特的自旋——x方向、y方向或z方向。如果我们这样测量,我们没有得到一个确定性的结果,正如我所说的,量子世界具有涨落。在量子力学原理中,你要知道,你能做到的是:得到在测量的三个方向上自旋向上或自旋向下的概率。
相比于单个经典比特的只有一种选择——要么是1,要么是0,对于量子比特,我们需要三个概率——三个数字,三个连续的数字即所谓的实数,来定义一个量子比特在做什么,它是什么状态,而不是只有一个选择,要么是0,要么是1。量子世界存在的现象,必须用复杂得多的方式对其描述。
我们试着形象化一些东西,它们是抽象的,但也都出自物理的具体研究。比特的值要么是0,要么是1,
而量子比特在涨落,一个量子比特的状态需要用三个数来表征,这就如同你在描述三维圆球中的位置时所需要做的一样。这已是状态空间的一个大扩展。
当我们开始考虑量子比特对时,事情变得更疯狂了。如果我们要描述它们的状态,我们可以选择在x方向测量两个量子比特,或者我们可以选择在x方向测量量子比特A、在y方向测量量子比特B,或者反过来,等等。共有九种可能性,每一种又都有其概率。然后我们也可以置一个量子比特于不顾,只测量另一个量子比特。这就引入了另六种可能性。基于量子力学原理,可以证明,每一个可能性都以一个独立的数字来描述。所以两个量子比特用15个数字描述——15个实数。以此类推,为了描述量子比特的状态,我们需要22N-1个实数。
在场的很多人应该知道如何解释这个数字22N-1有多大。一个量子比特,我们需要3个数字,两个量子比特,我们需要15个数字,三个量子比特,我们需要63个数字,四个量子比特,我们需要127个数字,等等。数字变得非常大,变得非常快。事实上,前几个例子还看不出来它会变得多么巨大。
有一个故事可以生动地比喻这个变化。这是一个关于国际象棋的故事,国际象棋起源于波斯、印度、中国或是其他地方,这不是故事的重点。国王对象棋非常满意,他非常喜欢这个游戏,于是想奖励发明者。国家就问这个发明者:“告诉我,你最想要什么。”象棋的发明者说:“我很谦卑,并不需要丰厚的报酬,只想每天都有米饭吃。而且我想将您的奖赏与象棋结合起来。所以请您第一天赏我一粒米,放在第一个正方形里,第二天,赏我第一天的米数的2倍,放在第二个正方形里,第三天的数量是第二天的2倍……”国王说:“这太荒谬了,也太少了吧,与你的成就不符呀。”但是象棋的发明者坚持就要这样的奖赏。于是国王便同意了。起初,这看起来像个玩笑。一开始是一粒米,然后两粒,然后四粒,八粒,然后十六粒。但是后来数量开始变得更多了。很快国王发现他的大米储备已经耗尽,他很尴尬,因为他要失信了。所以,他杀了象棋的发明者。
从中我们可以学到,不断翻倍,会产生非常快的增长。这就是所谓的指数增长,这就是为什么摩尔定律能使我们从巴贝奇使用的那种笨重的机器中快速实现了计算机的现代化。这也同样适用于量子计算机和传统计算机的对比。当你添加越来越多的量子比特,量子计算机的容量增长会非常非常地快,比传统计算机的比特数增长函数要快得多。因此量子比特的潜力非常大,它能开辟更为广阔的空间。
但是,它们很精微、脆弱。在最初的实现过程中,我向你们提到,是单个电子或单个自旋。它们很容易被扰乱。这些概率很容易被任何与外界的相互作用干扰。如果你用这些概率来编码你的信息,它们是非常脆弱的。所以我们需要保护这些量子比特不受外界以及彼此的影响,以保持信息的完整性。但另一方面,为了让他们做有用的工作,他们必须相互影响,以实施量子门或其他操作。最终,我们不想仅仅把我们的量子计算机当成一个黑箱来欣赏,开心于知道它的快和强大,我们想利用它解决问题!所以我们希望它能够输入和输出信息。因此,我们必须在量子比特的孤立和相互作用之间保持微妙的平衡,前者是量子比特完整性的必要条件,后者是量子比特执行必要事情的必要条件,也是量子比特偶尔与外界作用以获取、输出信息的必要条件。
物理学家和工程师正在探索几种不同的方法来制造实用的量子比特。这对物理学家和工程师来说是一个巨大的挑战,基本性的新思想已经出现。我认为,为了发挥出量子计算的潜力,还需要更多的新思想。在此,我将简要提及已经在进行的或正在追寻的三个主要方向。
一个是原子,用激光方法来实现;另一个是电路,以电子学方式来实现;还一个是任意子,用编织来进行计算。正如数字计算机从齿轮到真空管再到越来越小的晶体管,从磁带式驱动器到拇指般大小的驱动器一样,这项技术肯定也会不断发展。我们现在正处在一个非常早期的状态,可以说甚至还没到量子计算的“真空管”阶段,而是“分析机”时代。所以,我要说的是,还有其他的替代方法,虽然目前还不太发达,但也有可能会非常强大,如利用光而非原子,或利用固体缺陷。
这里为大家介绍一个粗略的,一个非常粗略的简单想法,一项正在研究的方法:里德伯原子方法。在这种方法中,你的量子比特或原子,被困在场中,场使得原子位置不动。你从而获得一个原子阵列,你知道它们的位置,所以可以定位它们。然后你用激光来进行激发。通常情况下,如果你什么都不做,它们的相互作用非常非常弱,它们是孤立的量子比特。如果你想让它们相互作用,你所做的就是用激光激发它们,然后原子会变得非常大,被称作“里德伯原子”。如果你把其中的两个变大,它们可以互相接触,互相影响。如果你做得恰到好处,你就可以执行布尔和图灵所述的那些操作。然后,通过发射辐射让它们冷却下来,恢复原样,然后继续重复这一操作。这是一种方法。
它有一定的局限性,因为你需要让原子保持距离。你需要用激光来定位。你还需要非常小心地让它们实现相互作用。这就是为什么我说我们处于发展的极早期。但是如果运气好的话,事情会越来越好的。会有一个新的摩尔定律,量子摩尔定律将开始呈指数增长。
Lukin和他的51量子比特的量子模拟机
这是我的朋友Misha Lukin,他制造了一台51量子比特的计算机。它不是通用计算机,所以我们称它为模拟器,基本上由里德伯原子排列构成。我选择这张照片是为了呈现现实的前沿实验所涉及的规模,还因为米沙是我的朋友,这是一张不错的照片。我是在网上找到的。
电路更为复杂,很难描述。即便是最简单的可能的逻辑门,电路也十分复杂!但是物理学家和工程师在设计复杂电路方面已变得非常、非常熟练,经验丰富。所以这是另一种被探索的方法,用来制造量子计算机。
这些量子比特能够代替比特的原因是电路非常小,并且以巧妙的方式涉及超导性,允许你有效地实现单独的量子比特0和1。这就是这个设计的物理实现。这是谷歌量子计算机,目前,已有53个量子比特[注:演讲时间为2019年11月]。这里温度很低。你看到的大部分是制冷器,实际的计算机就埋在这里的某个地方,非常小。利用这种设备,谷歌最近宣布其已实现了量子霸权。也就是说,这种设备在相当短的时间内,几分钟内就能完成一些事情,而经典计算机,甚至是当今最强大的经典计算机,体积有一个房间大,都需要花费非常非常长的时间来完成。关于到底要多长时间还有争议,但明显要久得多。他们制作了一个量子系统,难以对其进行经典模拟。
但是,你应该非常谨慎,非常仔细地理解这个词,量子霸权。某种程度上,它像是在暗示量子将是至高无上的,经典计算机将很快过时。根本不是这样的。事实上,量子霸权的整个概念是一个有趣的概念,因为我知道如何使用一个具有量子霸权的原子来设计量子计算机,并实际解决一个有用的问题,而不像谷歌,它是非常人工的。比如,这是一个碳原子,只是一个原子。它包含六个电子。它是一种非常有趣的原子,在技术上非常重要。在我们的生活中,我们的生活是由碳构成的。碳分子是有机化学的基础。没有经典计算机,也没有已知的量子计算机能像碳原子那样快地计算碳是如何与光相互作用的。我们无法计算。但碳原子能告诉我们,如果加热一个碳原子,会放出什么颜色的光。因此,这里传达的信息是,尽管有量子霸权这个词,但我认为技术是在演化的,而不是革命。我们会发现量子计算机将对越来越多的任务有用,但不会突然接管整个世界。
我要提到的第三种方法我特别喜欢,它特别有趣,物理学上称之为编织。用扭结来计算的历史可以追溯到南美洲的古印第安人。他们用扭结的数量和种类来表示数字。你可以用绳子来表示数字,互相发送信息,并用这些绳子进行计算。很明显,当你把物体缠绕在一起时,扭结会变得非常非常复杂。任何试图编精美发辫,甚至任何淋浴后想整理头发的人,都了解描述和控制缠绕的发辫有多么复杂。所以你可以在里面编码很多信息。如果你有合适的物理实体,电路,或者更高级的设备来掌控其缠绕方式,它们被称作任意子,然后你便可以用任意子来存储和处理信息。它们在其量子力学波函数中记录它们的历史。我的朋友和同事潘建伟在人工实现任意子的小规模电路上做出一些开创性实验。
任意子的量子模拟
正如我所说,通用量子计算机可能还有很长的路要走。然而,可为我们所用的量子单元可能会更快地到来。在经典计算机领域,人们设计图形处理器GPU来执行电脑游戏中的特殊操作,从而能够非常快地处理涉及屏幕上所有像素的许多简单计算。通用计算机要处理很多不同种类的任务,因为它们必须是通用的,所以它们对单一任务的处理速度要慢得多。
量子处理器、量子计算机,即使很小,但对于某些测试,得益于量子比特的能力,仍然能做得很好。所以,可以有一种混合设计,即一台经典计算机,它可以处理很多事务——很多经典计算机已经擅长的事情,
但是偶尔也需要一台量子处理器来完成特殊任务。我想这种应用方式很快就会出现。在现场的Peter Zoller就率先做出了这方面的努力。对于年轻人来说,在物理工程领域有着巨大的创造力和创新空间。这些量子模拟器,你可以认为就是现代的、量子版本的风洞。在飞机设计的早期,某种程度上今天人们仍然会通过风洞来模拟、测试可能的设计,而不是建造一架全尺寸的飞机。同样,我们可以在量子模拟器上模拟制造分子的条件,而不需要去化学实验室制造真正的分子。
另一种可能更容易理解和记忆的说法是,我们期望量子模拟器,小的量子比特集合,能够非常擅长于量子力学。尽管经典计算机很难精确地完成量子力学,因为量子比特变得非常复杂、非常快。如果为了制造新材料或新分子,你想计算许多相互作用的量子单元的性质,那么从量子比特这个方向寻找方案,并把量子比特当作计算单元可能会极其有帮助。已经有一些与量子模拟器使用相关的具体想法,这要比试图制造一台全能的图灵机容易得多。
至此,我们已经讨论了作为奇特新脑的数字计算机和量子计算机。量子计算机是用物理概念(与人类大脑很不同)来体现信息和思想的奇特新方法。我想再讨论一个领域,近年来这一领域取得的成功令人印象深刻,其更接近于人类大脑的工作方式,但是却是人工的和工程的。它被称为神经网络。
到目前为止,我讨论过的计算机,以及各种奇怪的“脑”,在设计和概念上与人类思维有很大不同。它们处理的符号、抽象和物理元素与人类大脑的工作方式完全不同。生物学的运作方式是不同的,它使用的单元速度慢得多,但各单元之间的连通性比人工机器、电子计算机或任何现有量子计算机设计中的连通性要高得多。它有分层的体系结构和巨大的并行性,这与你在计算机芯片中发现的完全不同。
小脑架构
这是人类视网膜的示意图,是我们最好用的图像处理器,在许多方面的表现,比任何计算机都要优秀。这是人类小脑的示意图。这部分是专门用来同步我们的肌肉,保持我们运动平衡的。同样,它也有这种分层结构。没人知道它的详细工作原理,但是它非常强大,非常擅长它的工作。没有一个人类设计的机器人可以像人类一样自如地移动。
所以,尽管这些单元很小、很慢,不像人工计算机部件那样制作精密、那样可靠,但它运作起来非常流畅,这就是人类特有的优势。基于这种观察和经历,人类得到启发,这种非同寻常的架构可以很好地实现思维,构建第三种奇特新“脑”。这里的基本构件不是一个单元,不是经典计算中的1或0,也不是它的量子推广(如量子计算中的),而是所谓的神经元。
这是一个神经元模型。你所要做的是进行输入,输入的是数字和权重,权重也是数字。然后,你对基于数字和权重的输入进行相乘或者其他处理,然后将其导入你的神经元,神经元根据输入值产生输出,如此循环。你可以用一种神经元的输出作为下一层神经元的输入。这是一个简单的理想化模型,以进入神经元并产生输出信号的电信号来描述实际的生物神经元是如何工作的。其优点是我们可以用程序进行设计和操作。
这个领域的伟大发现经历了几个阶段,但如今已经发展成一个非常精细和强大的实践理论,那就是可以自主学习的简单神经元的网络。它们可以通过改变权重来学习,这样它们的表现就会越来越好。这一基本原理是这样的:假设你的神经网络通过观察大量的图像来获取输入,并对它们所看到的进行编码,然后将信息发送给另一层神经元,然后将它们的输出传播到再一层的神经元,然后再传递到输出端,这可以解释为一条信息,告诉你原始图像中编码的信息是什么。例如,你可能有一个神经元,如果原始图像包含猫、人或某一类人脸,它就会发光。现在假设你的图像包含一只猫,但是你的输出中没有猫或者只有其他事物。这就是一个错误,那么如何做得更好?神经元知道产生了错误的答案,就像一个老师告诉它答案是对还是错。如果有一个错误,这个神经元会告诉大脑,告诉它的前一层神经,它犯了一个错误,进而改变它的权重,这样就会更正错误。神经元说,好,我稍微改变一下,这样我会给你一个更好的答案。然后,如果这个单元也错了,它责怪上面的那层单元,告诉它:你犯了一个错误。这层单元会说:哦,我犯了一个错误,所以如果我有不同的权重,我可以做得更好;我会稍微改变一下权重。如此反复进行。
这是一个非常非常简单的想法,叫作反向传播。这是一种系统地从错误中学习以提高权重的方法,这样它们会给出越来越多的正确答案和越来越少的错误答案。这已经实现了,被称为深度学习。这带来的成功可以说令人印象深刻。深度学习神经网络已经非常擅长在图像、人脸或猫领域进行识别,而且还精通曾经被认为是人类智力顶峰的事情,比如:国际象棋,围棋,高等级的星际争霸游戏。
举一个象棋的例子,它令我印象深刻,可能是因为我对象棋的了解比对围棋或星际争霸要多一些。象棋已被人类深入研究了几个世纪,关于它的文字资料非常丰富。有的人类棋手终其一生都在精进棋艺,并且认为对象棋的理解已经相当透彻了。将国际象棋的规则输入神经网络,通过与自己对局,在几天内,甚至几个小时内,通过使用深度学习策略,神经网络的棋艺就可以赶超任何人类玩家,同样也比人类通过编程而设计出的经典计算机棋手要好得多。这难免令人类汗颜,我们创造的事物竟可以在某些方面完成我们认为是智力顶峰的任务,并且做得更好。如果你认为棋类等游戏不是很重要,神经网络在其他一些问题上比任何程序或人类也表现得更好,比如确定一个DNA密码的化学结构和它的形成机理及形状。
我重点介绍了这些应用反向传播学习的神经网络,但是它们还不是最有能力的。我们的大脑更为复杂,其出色的秘密就在于对反馈的审视。它包含的不仅仅是单向的信息流,还有对返回信息的再处理。是的,大脑网络在审视自己的行为。简单地说,就是大脑在思考我们在做什么。
传播网络并不思考它们在做什么,它们只管传播。它们不反省,也不检查自己的表现。因此,接下来是思考的下一个层次,我们需要超越反向传播,研究审视和指导其他网络的网络。审视自身行为,很有可能除了监控外部世界和身体状态的传感器之外,我们还有监控、预测、评估和指导我们内部大脑状态的模块,这些模块观察我们在想什么。换句话说,就是在观察和审视我们的意识。
我们思考我们正在思考什么。这可能与意识密切相关,本质上也可能就是意识。事实上,有一个叫Benjamin Libet的人在20世纪70年代开创了一个很经典的实验。我相信,随后也得到了许多其他复杂的实验验证,这些实验指出了这样一种观点,即我们所说的意识不是在决定要做的事情,而是在观察我们大脑中正在发生的事情,并对其进行报告。
我向大家展示这个经典的实验,它改变了我对自己在这个世界上的看法。这是一个极其简单的实验。
这是它的卡通版示意图。实验人员安排给受试者一个非常简单的任务。受试者被要求做两件事,即每隔一段时间,每当他或她想按按钮时,也看一下时钟,记录下是何时决定按下按钮的。所以当受试者决定按下按钮时,他会报告做出决定的时间。这就是这个实验的过程。实验的第三个组成部分是受试者处于一个监控大脑活动的电子设备中。实验发现,当受试者报告说他们做出了决定,这个时间要比大脑活动晚0.2秒左右,而大脑活动是导致按下按钮的原因。大脑的深层结构先于对行为意愿的意识。正如我所说,现在有许多这类实验,有许多先进的现代技术,都验证了这一结果。简单地说,如果此类实验结论是正确的,人工神经网络的一大进步将会是对“意识”的引入。
就物质方面而言,我们也应该借鉴生物学理论。我们应该引入自我复制理论。我们大脑的成长来自细胞的成长,细胞通过自我繁殖和自我配置,一倍又一倍的增长。人类大脑的形成过程很特殊,而且成本也低得多;当然比人工大脑的制造方式更有趣,因为它是由进化产生的,而人工大脑可以更快、更大规模地人工制造。这是就是未来的物理工程。这是一个关于自我复制的粗略想法。伟大的数学家约翰·冯·诺依曼,顺便说一句,他开创了作为所有现代计算机基础的被称为诺依曼架构的理论,他写了一本书,概述了如何制造一个自我复制的机器和生物体。
总结一下今天的内容,也展望一下未来。我认为即将出现几种奇特而强大的新“大脑”。这为想要改变世界的年轻人敞开了大门。这些领域为研究者提供了很大的创造空间。物理学和物理学家都有很多可以发挥才能的领域。
谢谢大家。
以上内容来自Frank Wilczek在“墨子沙龙”的演讲(2019年11月)