第101章
“我们的感官接受很多种信号:视觉接受电磁波,听觉接受声波,还有压力、惯性方向、热量转移速率、无数种化学分子,气溶和水溶分子接收体系还不一样……大脑可不像计算机,为每种信号规定一种格式。大脑在神经系统的边界层就把它们全都转换成神经元冲动,在内部全都存储为组合序列。所谓冲动,就是一个神经元以电位形式兴奋起来,并把兴奋传给连着它的另一个神经元。每个冲动本身都是一模一样的,区别只在于从谁传给谁。所谓组合,就是哪些神经元一起兴奋。所谓序列,就是不同组合兴奋的先后顺序。这就是大脑唯一的数据形式,大脑用它解决所有问题。它完全依托于神经元之间的网络存在,没有连接就没有数据。所有写过程序的人,请你们仔细品品这种数据结构。多简洁,多优美!
“我们每时每刻都在接受海量的感官信息。视网膜感光细胞就有几百万个,看电影时每秒激励10次左右,已经赶不上电影每秒几十帧的刷新率。虽然大脑有上千亿个神经元,也不可能存下这么多组合序列。这跟下围棋不可能计算穷尽是一个道理。于是大脑使出第二招:模式抽象。
“假设你在看书。印刷文字反射的光线投在你的视网膜上,感光细胞开始一群群激励,向大脑中连着的神经元发送冲动。有些冲动的组合序列代表受激励的感光细胞直线排列,大脑把它抽象为“直线”,在上一层用一个或者几个细胞的组合代表。同样的方法也产生“弧线”这样的抽象。几个‘直线’和‘弧线’的特定序列组合,在更上一层抽象为字母h。几个不同字母的组合序列,在更上一层抽象为单词horse。记录horse的组合序列,会跟另外一些早已存在的序列连接起来——比如你听见这个单词的读音产生的序列,那是耳朵接收音频转换生成的序列。
“所谓连接,就是共同激励,你一兴奋我就兴奋。英国和美国口音horse的念法不同,男人和女人的声音频率也差得远。但是没有关系,它们跟视觉产生的单词序列都连在一起,还跟你曾经看见一匹马的视觉图像序列连在一起。除了英文你还会说中文。那么,ma的发音跟horse天差地远,在你大脑中两个代表不同音频的序列仍然连在一起。这几个序列彼此全部连通,那么就会再次向上层细胞抽象。在这一层,‘马’已经甩掉了黑毛还是白毛、听觉还是视觉、文字还是图像、中文还是英文这些不必要信息,成为一个真正的概念,用一个特定神经元组合记下来。我们可以叫它马细胞。那么以后你不管通过哪种感官接收到关于‘马’的信息,甚至闭上眼自己想一下,马细胞都会兴奋起来。”
“它还会跟大脑中许许多多其它概念连起来。比如另有一个‘牛’的概念。这两个东西的组合序列会很相似,因为抽象出它们的下层序列和关联概念,很多都是重合的。比如四条腿,比如都能被人养。大脑会发觉这两个组合序列相似,虽然不清楚该叫什么,先连起来再说。以后你再听到‘家畜’这个说法,更高一层的概念名字就取好了,新的存储组合也生成了,以后认识的猪和羊都连到这里。这就是大脑的第三招:分类。这种层层抽象还会向上延伸,比如生成‘动物’的概念。还会跟其它概念产生横向连接,比如‘马’可能连接到‘老婆’。为什么会这样连接?因为‘马’这个概念的下层包括一张抽象的、长长的脸。你的大脑中“老婆”这个概念已经连到了这里,双方共用这个下层概念神经元组合,所以连上了。连上之后,别人小声说‘母马’,你就会很敏感,觉得是在骂你老婆。”
听懂的人都听得痴了。没听懂的又开始推测图海川的婚姻问题。
“组合序列记录、模式抽象、分类。大脑就靠这三招,在内部建立了一个世界模型。如果这个模型是一座大厦,我刚才描述的局部就比一块砖还小。然而,整个大厦都是用这种机制建成的。这个世界模型的物理位置在大脑皮层,仅仅用了六层细胞,大概一千亿个。我们遇到的每一个需要智能解决的问题,大脑都在建好的世界模型中推演,就像棋手先推演下面几步,再落子。这叫预测。或者根据新的信息,先在世界模型中增添新组件,和旧组件建立连接,再来推演。这就叫学习,或者叫记忆加预测。
“做ai的人都有共识:智能的本质就是记忆加预测。我们头骨里面这个记忆-预测模型,有些人大,有些人小,所有人都有不同程度的歪曲。但大脑解决所有问题都是把它放在整个世界模型中运行。这样来看大脑,它不是通用智能才怪!”
没有一个人说话,没有一个人的眼睛离开图海川的脸。只有一些小国代表受不了自己的译员了,用耳机连上公共翻译。
“一个小巧、简洁、通用的世界模型。听起来就能把人迷死。想制造大脑的人远远不止我一个,古往今来太多了。为什么他们都失败了?我们再回头来看看连接主义者,在我之前最近的尝试。”
“他们的直觉其实是对的。分布式网络,单元最简行为,海量输入数据施加压力,让网络自己学习、生长、进化。这些都是构造大脑的基本原则。世上最复杂的东西都是长出来的,而不是设计出来的。也不要以为‘连接主义’在ai界成了贬义词,它就死掉了。当今主流的ai技术:深度学习或者机器学习,它们的内核还是这些原则,只是设计使用的数学工具先进了无数倍,再加上不声张而已。你最多能听见他们说‘黑箱卷积’或者‘玄学调参’。
“我们每时每刻都在接受海量的感官信息。视网膜感光细胞就有几百万个,看电影时每秒激励10次左右,已经赶不上电影每秒几十帧的刷新率。虽然大脑有上千亿个神经元,也不可能存下这么多组合序列。这跟下围棋不可能计算穷尽是一个道理。于是大脑使出第二招:模式抽象。
“假设你在看书。印刷文字反射的光线投在你的视网膜上,感光细胞开始一群群激励,向大脑中连着的神经元发送冲动。有些冲动的组合序列代表受激励的感光细胞直线排列,大脑把它抽象为“直线”,在上一层用一个或者几个细胞的组合代表。同样的方法也产生“弧线”这样的抽象。几个‘直线’和‘弧线’的特定序列组合,在更上一层抽象为字母h。几个不同字母的组合序列,在更上一层抽象为单词horse。记录horse的组合序列,会跟另外一些早已存在的序列连接起来——比如你听见这个单词的读音产生的序列,那是耳朵接收音频转换生成的序列。
“所谓连接,就是共同激励,你一兴奋我就兴奋。英国和美国口音horse的念法不同,男人和女人的声音频率也差得远。但是没有关系,它们跟视觉产生的单词序列都连在一起,还跟你曾经看见一匹马的视觉图像序列连在一起。除了英文你还会说中文。那么,ma的发音跟horse天差地远,在你大脑中两个代表不同音频的序列仍然连在一起。这几个序列彼此全部连通,那么就会再次向上层细胞抽象。在这一层,‘马’已经甩掉了黑毛还是白毛、听觉还是视觉、文字还是图像、中文还是英文这些不必要信息,成为一个真正的概念,用一个特定神经元组合记下来。我们可以叫它马细胞。那么以后你不管通过哪种感官接收到关于‘马’的信息,甚至闭上眼自己想一下,马细胞都会兴奋起来。”
“它还会跟大脑中许许多多其它概念连起来。比如另有一个‘牛’的概念。这两个东西的组合序列会很相似,因为抽象出它们的下层序列和关联概念,很多都是重合的。比如四条腿,比如都能被人养。大脑会发觉这两个组合序列相似,虽然不清楚该叫什么,先连起来再说。以后你再听到‘家畜’这个说法,更高一层的概念名字就取好了,新的存储组合也生成了,以后认识的猪和羊都连到这里。这就是大脑的第三招:分类。这种层层抽象还会向上延伸,比如生成‘动物’的概念。还会跟其它概念产生横向连接,比如‘马’可能连接到‘老婆’。为什么会这样连接?因为‘马’这个概念的下层包括一张抽象的、长长的脸。你的大脑中“老婆”这个概念已经连到了这里,双方共用这个下层概念神经元组合,所以连上了。连上之后,别人小声说‘母马’,你就会很敏感,觉得是在骂你老婆。”
听懂的人都听得痴了。没听懂的又开始推测图海川的婚姻问题。
“组合序列记录、模式抽象、分类。大脑就靠这三招,在内部建立了一个世界模型。如果这个模型是一座大厦,我刚才描述的局部就比一块砖还小。然而,整个大厦都是用这种机制建成的。这个世界模型的物理位置在大脑皮层,仅仅用了六层细胞,大概一千亿个。我们遇到的每一个需要智能解决的问题,大脑都在建好的世界模型中推演,就像棋手先推演下面几步,再落子。这叫预测。或者根据新的信息,先在世界模型中增添新组件,和旧组件建立连接,再来推演。这就叫学习,或者叫记忆加预测。
“做ai的人都有共识:智能的本质就是记忆加预测。我们头骨里面这个记忆-预测模型,有些人大,有些人小,所有人都有不同程度的歪曲。但大脑解决所有问题都是把它放在整个世界模型中运行。这样来看大脑,它不是通用智能才怪!”
没有一个人说话,没有一个人的眼睛离开图海川的脸。只有一些小国代表受不了自己的译员了,用耳机连上公共翻译。
“一个小巧、简洁、通用的世界模型。听起来就能把人迷死。想制造大脑的人远远不止我一个,古往今来太多了。为什么他们都失败了?我们再回头来看看连接主义者,在我之前最近的尝试。”
“他们的直觉其实是对的。分布式网络,单元最简行为,海量输入数据施加压力,让网络自己学习、生长、进化。这些都是构造大脑的基本原则。世上最复杂的东西都是长出来的,而不是设计出来的。也不要以为‘连接主义’在ai界成了贬义词,它就死掉了。当今主流的ai技术:深度学习或者机器学习,它们的内核还是这些原则,只是设计使用的数学工具先进了无数倍,再加上不声张而已。你最多能听见他们说‘黑箱卷积’或者‘玄学调参’。