首页 > 学习

250|认知管理3:神经生物模型 卓克·科技参考2(年度日更) 卓克·科技参考2(年度日更)

250|认知管理3:神经生物模型 卓克·科技参考2(年度日更)

250|认知管理3:神经生物模型

 

欢迎回到《科技参考》,我是卓克。

 

有时候,我们用手机导航在高速公路上开车的时候,手机上突然叮的一下弹出微信消息,你看到了,怎么办呢?一般情况下就是默念“来消息了”,但还是继续保持原来的驾驶状态,你会克制住自己看手机的欲望,因为司机边在高速公路上开车边看微信非常危险。直到终于进入休息站后,你才把消息看了。

在这个过程中,你是怎么克制住自己不看手机的呢?在 1990 年的时候,曾经有一个关于神经控制的模型来解释这件事。今天的《科技参考》,我就来为你介绍这个模型。

 

这个模型其实就是今天各种人工智能界使用的深度神经网络的雏形。说雏形是因为它并不深,只有三层而已,而今天比较复杂的深度神经网络有好几十层。不过,它和今天的神经网络也有所区别,因为它多了一个根据任务筛选结果的步骤。

下面我们具体说说。


斯特鲁普实验

由于这一期内容涉及到字体的颜色,所以建议你点开屏幕看一看文稿,这样更方便理解。当然,如果看不了,影响也不是很大,我会把字体颜色和字符的发音都着重给你念出来。

 

我们看一个最最简单的斯特鲁普实验:

 

“红色”

 

(字体颜色为绿色)。注意,这个词的发音念成“红色”,但实际字体是加粗的绿色。我的要求是当你看到这个字符后,根据颜色也可以,根据单词的发音也可以,总之,放开嗓音念出一个结果给我,现在请你念出来。我想,绝大多数人看到这个加粗的绿颜色的“红色”二字时,还是会脱口而出“红色”。

好,下面我们换一个词。“ red”(字体颜色为绿色),和刚才一样,虽然发音念“ red ”,但实际上字体颜色是加粗的绿色。现在,无论是它本身的颜色,还是这个词本身的发音,请你看到后念出来。我想,如果有投票功能的话,这次把“ red ”这个词的字体颜色,也就是绿色,说出来的人,会比刚刚用中文举例的时候要多得多。

 

我们继续换一个词。“あか”(字体颜色为绿色),同样是绿颜色的字体。不论是单词本身的发音还是它本身的颜色,请你念出来。我想,这次除了少部分学过日语的朋友,绝大部分人说的结果都是“绿色”。但其实,あか是日语中“红色”的意思。


神经控制模型

现在问题来了,同样都是表示“红”这个颜色的词,并且都用加粗的绿色给它染色。为什么用中文写的时候,几乎所有人都念出了“红色”二字,换成“ red ”后,就有更高比例的人嘴里念出了“绿色”,而换成了“あか”后,几乎所有人都念成了“绿色”,也就是这个词的字体颜色呢?

 

其实,那个神经网络模型就在解释这件事。

 

这个模型把一个外界刺激输入到大脑、然后经过加工、最后再通过大脑中运动神经元控制肌肉输出这个过程,粗略地分为三层。

 

最底一层叫“接收层”,用来接收各类外界刺激。

 

比如,红颜色是一种刺激,由一个神经单元接收;绿颜色也是一种刺激,由另外一个神经单元接收;“绿”这个词是一种刺激,由一个神经单元接收;“红”这个词也是一种刺激,也由一个神经单元接收。总之,每一个能区分出来的特征都由一个单独的神经单元接收,不遗漏任何一个。

 

神经单元接收到外界刺激之后会活跃,产生电信号,往下一级传导。谁又是下一级呢?在这个模型里,下一级被称为“隐藏层”。隐藏层可能是 1 层,也可能是 50 层。今天人工智能使用的深度神经网,“深度”的意思就是指这个隐藏层可能有好几十层,非常有深度。

 

隐藏层有一端和接收层相连,收到它的电信号后会做加工,加工后会输出反应结果。反应结果这一层就叫“反应层”。

那么,这个模型的关键就是,隐藏层到底做了哪些“加工”呢?是把 N 个输入加和后取平均值?还是 N 个输入选最大值采纳?其实都不是,而是和刚刚那两种处理风格完全不同的另一种处理方法。

 

具体来说,隐藏层是如何处理的,完全没有自上而下的规定,比如必须用某几个输入值再结合什么公式算出来,不是的,而是可以随便输出任何值。

 

从接收层流进来的电刺激自然而然的刺激隐藏层里的神经单元,然后那些神经单元按照被刺激的强弱和与接收层神经单元连接的强弱两个维度的指标,来决定自己是否把刺激继续往下传。

 

如果接收层神经单元输入的电刺激太弱了,隐藏层对应的神经单元就不再响应这个刺激,相当于对接收层送来的信号采取了静默的态度。你刺激我,但因为你的刺激太弱了,我没有把这份刺激传下去。

 

如果接收层神经元输入来的电刺激虽然很强,但由于与之对应的隐藏层神经元和接收层的电缆线太细了,没能把这么强的刺激转化为激活信号,与之对应的隐藏层单元就还是不能被激活。也相当于对接收层送来的信号采取了静默的态度,只不过这次的原因不是信号不够强,而是连接太弱了。

 

要不要对接收层送来的信号做响应,自己也高度活跃起来,把刺激继续往下传,是由两个因素决定的,一个是输入来的信号本身的强弱与否,另一个是与输入信号的神经单元连接的粗壮程度。

 

由于处理方法没有一定之规,所以最初由隐藏层输出的结果是没有什么规律的。但人们可以通过最终结果来进行干预,或者更准确应该说成是“塑造”,塑造隐藏层如何处理信号。


对实验结果的分析

现在,让我们回到认汉字这个例子。

我们可不是等到今天这篇《科技参考》才遇到认读汉字的任务的,我们从四五岁起就被要求认读汉字了,到现在学会了几千汉字,还会每天不停的用。

 

所以对我们来说,接收层里和每个汉字对应的神经元,把刺激送入隐藏层的过程是占尽优势的,一个汉字的出现能引起足够强的神经单元兴奋。并且由于我们已经强化训练了很多年,于是隐藏层里,与接收层中汉字对应的神经元的连接也是极为粗壮的。这两个因素都非常强。

 

而与此同时,我们也是从小就学会辨认颜色的,所以那些和颜色对应的接收层神经单元的激活程度也不低,它们也会把神经刺激传入隐藏层。但相较于加工汉字来说,在隐藏层加工颜色的神经单元和接收层的连接就没有那么粗壮了。

 

于是,隐藏层再往下一层传输时,总是加工汉字的那一路神经在逐级传导刺激方面更占上风,权重更高;而加工颜色的那一路,权重较低。于是,在不做任何强制要求的情况下,让你必须看到带颜色的词后念出点什么,你总会毫不犹豫的把“红色”这个词的发音念出来,尽管实际上这两个字是加粗的绿颜色。

 

但如果把“红色”换成了“ red ”,权重的对比就有变化了。因为在我们之前的训练中,认读英语单词,给两层神经元连接强度的贡献不如汉字那么多,连接的粗壮程度不如汉字,于是在某些场合里,权重较低的颜色加工结果就会冒出来,“绿色”二字就脱口而出了,而没有念成“ red ”。

 

继续沿着这个逻辑分析,“あか”可没有多少人认识,这时候从两层神经单元连接的粗壮程度来看,读字音是几乎没有连接的,读色彩的连接还是不错的,于是绝大多数人都会脱口而出“绿色”二字。

 

当这个神经网络是机器的时候,最初的训练要由人监督完成。

比如,你想让它按色彩念,就得时刻盯着输出结果,如果最终输出的结果是按发音念的,那么就要适当调整各单元间的连接强度,直到盲测时每次都自动按照字体颜色念为止。

 

当这个神经网络是生物的时候,虽然不存在外部监督,但却存在更残酷的塑造过程,就是在巨大的基数里筛选出少数几个偶然塑造正确的个体。

 

一个很好的例子就是,灵长类动物正是因为能辨识出更多的颜色,所以果实是成熟的还是未熟的,它们就能一眼看出来,于是就能摘到更多成熟的果子,更有利于自己生存。

 

如果运气不好,神经单元没有往正确的方向塑造,等待生物个体的就将是温饱和生育率上的惩罚。

 

当然,后来高级的神经系统也配备了一个奖励单元,当某次偶然的权重塑造过程在正确的时机涌现出来,马上给予一剂多巴胺奖励,生物体就会感觉无比愉悦。为了追求这样的愉悦感,这条神经通路反复被激活,于是逐渐粗壮了起来。


人类控制系统和神经网络

以上只是人类控制系统的一部分。

 

我在开头说了,人类控制系统和今天的神经网络也有区别,因为它多了一个根据任务结果的额外筛选步骤。也就是,在刚刚神经网络系统的最上层又加了一层,我们叫它“任务需求层”。

 

它每时每刻都接收着由反应层,也就是那个类似于深度神经网络输出的东西,给它的多个结果,并由它签字做最终判罚。

所以尽管我们对汉字的识别极为成熟,神经单元的兴奋度足够高,几层之间连接的粗壮度也足够棒,但这个输出结果依然等候在任务需求层里,另外几个兴奋度足够但又不是很高,连接粗壮度也尚可但权重不足够高的结果,也会在任务需求层里等待。经过这一级的加工之后,再裁决把哪个结果输出。

 

由于这一级需要额外的加工,要依照记忆中的内容把若干输出结果和任务做比对,于是需要更多时间。这就是我们做斯特鲁普实验时,一旦字符使用的是母语,要求让你说字体的色彩名称而不是念那个词的时候,你通常都会比直接念单词要慢得多的原因。因为你的任务需求层在做进一步加工,这一步加工也是需要时间的。

 

相比较而言,动物就直接很多。它们的肌肉动作绝大部分都是反应层的直接输出,很多都是生物本能,于是它们需要额外的刻意训练才能抑制住食物诱惑,先完成高难度的动作,然后再满足食欲。

 

而额叶越发达,也就意味着任务需求层的工作效率越高。

好,这就是今天的内容。我是卓克,我们明天再见。

用户留言

猜你喜欢

最近发表
推荐