人工神经网络的本质（物理或数学意义）是什么？

请用语音读文章

热门回答：

作者曾经写过系列文章《神经网络与深度学习概述》。其中在《第二章神经网络的概念及感知机模型》。从生物和数学方面都有一定介绍。

神经网络全称人工神经网络（Artificial Neural Network, ANN）。与之相对应的是生物神经网络（Biological Neural Network, BNN）。将模拟生物神经网络的数学模型统称为人工神经网络模型。

生物神经系统与生物神经元

大量生物神经元的广泛、复杂连接。形成生物神经网络

实现各种智能活动

智能（intelligence）

观察、学习、理解和认识的能力

理解和各种适应性行为的能力

智能是个体有目的的行为、合理的思维、以及有效的适应环境的综合能力。也可以说是个体认识客观事物和运用知识解决问题的能力

生物神经元(neuron)是基本的信息处理单元

生物神经系统

生物神经元是基本的信息处理单元。

生物神经元

树突(dendrites)：接收来自外接的信息

细胞体(cell body)：神经细胞主体。信息加工

轴突(axon)：细胞的输出装置。将信号向外传递。与多个神经元连接

突触（synapsse)：神经元经突触向其它神经元（胞体或树突）传递信号

生物神经元的基本特征

神经元之间彼此连接

神经元之间的连接强度决定信号传递的强弱

神经元之间的连接强度可以随训练改变：学习、遗忘、疲劳

神经网络中各神经元之间连接的强弱。按外部的激励信号做自适应变化

兴奋与抑制

信号可以起兴奋作用。也可以起抑制作用

一个神经元接受信号的累积效果（综合大小。代数和）决定该神经元的状态(兴奋、抑制)

每个神经元可以有一个“阈值”

人工神经网络的组成与结构

人工神经网络是由大量处理单元经广泛互连而组成的人工网络。用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。

人工神经网络可看成是以人工神经元为节点。用有向加权弧连接起来的有向图。在此有向图中。人工神经元就是对生物神经元的模拟。而有向弧则是轴突—突触—树突对的模拟。有向弧的权值表示相互连接的两个人工神经元间相互作用的强弱。

神经元及神经网络模型

感知机模型

感知机模型。其基础就是单个神经元模型

感知机的学习是有监督的学习。学习的问题归结为求权重系数W = (w1, w2, …, wn)和阈值θ 的问题

基本思想：逐步将训练集中的样本输入到网络中。根据当前输出结果和理想输出结果之间的差别来调整网络中的权重值

感知机模型

感知器模型无法解决“异或”（XOR）问题。即感知器模型无法解决非线性可分问题。

设激活函数f(x)为阶梯函数：

阶梯函数

由于单层感知器的输出为：

y(x1,x2) = f(ω1×x1+ω2×x2-θ)

用感知器实现简单逻辑运算的情况如下：

“与”运算（x1∧x2）

令ω1= ω2=1。θ=2。则 y=f(1×x1+1×x2-2)

显然。当x1和x2均为1时。y的值1；而当x1和x2有一个为0时。y的值就为0。

“或”运算（x1∨x2）

令ω1= ω2=1, θ =0.5。则y = f(1×x1+1×x2-0.5)

显然。只要x1和x2中有一个为1。则y的值就为1；只有当x1和x2都为0时。y的值才为0。

“非”运算（～X1）

令ω1 =-1。 ω2=0。 θ=-0.5。则 y = f((-1)×x1+1×x2+0.5))

显然。无论x2为何值。x1为1时。y的值都为0；x1为0时。y的值为1。即y总等于～x1。

“异或”运算（x1 XOR x2）

如果“异或”（XOR）问题能用单层感知器解决。则ω1、 ω2 和θ 必须满足如下方程组：

ω1+ω2-θ＜0

ω1+0-θ≥0

0+0-θ＜0

0+ω2-θ≥0

显然。该方程组是无解。这就说明单层感知机是无法解决异或问题。

神经网络模型（多层感知机Multi-Layer Perception）

在单层感知器的输入部分和输出层之间加入一层或多层处理单元。就构成了二层或多层感知器

多层感知器克服了单层感知器的许多缺点。原来一些单层感知器无法解决的问题。在多层感知器中就可以解决。例如。应用二层感知器就可以解决异或逻辑运算问题

其他观点：

从数学的角度讲。人工神经网络的本质从机器学习的过程可理解为通过参数求最佳解得过程。同样也是一个负反馈的过程。以最简单的负反馈神经网络bp神经网络(back propagation)为例。其本质可以形象的理解为这样一个过程：

我们假设这个刚搭建的好的机器人叫“小明”（假设他刚出生）。他的硬件软件等我们不需要考虑的部分全部是最先进的。小明的大脑里现在是最纯净的。除了一个学习的算法什么都没有。就像一个刚出生的婴儿一样。

现在。小明饿了。想吃东西。那么如何才能吃到东西呢？在什么都不知道的情况下。小明开始探索如何才能不饿。他可能会伸手。或者笑、哭。于是母亲喂了他吃的。从逻辑上可以这么理解：

然后他每次饿了。都开始伸手-笑-哭。然后就有吃的了。突然。有一天他自己也不知道怎么搞的。直接哭了。然后---有吃的了！！！这时他才明白这一个逻辑：

这时候。机器人“小明“明白。其实达到一个目的很简单。但是需要不断尝试。

再后来。小明又饿了。这回他懒得动。稍微小哭了一下等吃的。结果妈妈没来喂他！这是为啥？然后他就哭的超级大声。妈妈看他这样子以为是病了。急冲冲的送她去诊所。结果啥病也没有。小明迷惑。这是为什么？逻辑可以这么理解：

然后他把哭声再稍微降低以点。变成了很正常的哭。这时妈妈终于恍然大悟。喂他吃的。小明终于明白。想吃东西。首先需要哭。然后若哭声小。不起作用。需要调大哭声。若哭声过大。会起反作用。需要把哭声再降小一点。就有吃的了。

以上就是人工神经网络的本质。通过不断尝试引入各种参量。最终得到允许误差范围内的解。并通过引入参量系数。最终得到最优解——喂食=哭。通过负反馈机制。当参量所占权重过小。以当前参量所得结果为参考依据适当增加参量权重比例。增加的比例的系数随机。通过第二次的结果和第一次的结果选择更合适的权重系数。最后经过不断的“尝试“得到最优解。

以上过程即是bp负反馈神经网络的算法思想。

其他观点：

数学的角度看。网络模型本质上是函数的表示模型。学习的过程就是通过数据匹配实现函数建模的过程。实现数据的逼近或拟合。网络模型的结构和规模决定模型的表示能力。表示能力越强。建模需要的数据规模也越大。或者学习利用数据能力越强。同时学习需要的计算资源也会越多。显然。深度学习实现的网络模型就是可以利用大数据实现丰富表示能力的函数建模。

桔子生活网

更多热点文章推荐

发表评论取消回复

评论(2)

外部推荐

评论展示

随机推荐

更多热点文章推荐

相关推荐

有没有甜宠的总裁小说分享？

用棉签给六个月的宝宝通便有没有依赖性？

港姐邝美云近况如何？

有什么带直播和弹幕的超甜耽美文推荐？

发表评论 取消回复

评论(2)

随机推荐

发表评论取消回复