深度学习第一弹：从神经元到感知机

小D博士
- 2021年8月17日

一、前言

要想跑需要先学会走，任何复杂技术的背后其实都是依赖像1+1=2这样简单的理论来支撑的，所以基础很枯燥但也重要。二、深度学习（DeepLearning）人工智能现在已经慢慢的深入我们的生活之中。比如人脸识别，语音翻译，自动驾驶等等。环顾我们四周，以前一部分只有人可以做到的事情，现在人工智能也能做，甚至做的比人类更好。然而这么牛X的东西背后都有哪些技术呢？不知道没关系，因为我也不知道。但是我知道这其中有一项很很很重要的技术就是【深度学习】。什么是深度学习？怎么实现？那你问对人了。小的不才，略懂一二。首先什么深度学习。生硬的理论知识我就不讲了，也不会讲。咱就举个通俗易懂的例子。比如小朋友学习认识数字1。你在黑板上画一道竖线告诉她，这是数字1，她记住了。那么你再画一道横线问她，她也许会不假思索的回答1，因为在她的认知里，一个短线就是1，管它横的竖的。这时候如果你告诉她错了，1应该大概是一根竖线，这样子她就学会了。为什么呢？因为她找到了数字1的特征或者说是规律（一根竖线，大体上是直线）。其实这就是一个简单的深度学习。通过从一堆看似很杂乱的数据里找到特征，规律，然后利用这些特征去认知一些新的东西。那么深度学习是怎么实现的？答案便是神经网络。三、神经网络

又是一个新名词，其实神经网络就是通过计算机模拟人的神经的工作方式的一种模型。是不是很神奇，很牛X。有时候不得不佩服那些满脑子奇思妙想的人，人类的发展就是靠这些牛人推动的。言归正传，今天的主题便是神经网络的最小单元：感知机（perceptron）。如下图所示

感知机就是一个有多个输入信号，一个输出信号的模型。如上图所示，x1，x2就是输入信号，y是输出信号，w1，w2是权重（weight）（后面会说明什么是权重），每一个圆圈代表一个神经元。输入信号通过神经元传送的时候，先对各自的权重进行乘法计算，然后再求和（x1*w1+x2*w2）。如果这个和大于某个预先设定的临界值（阈值θ）的话就输出1，否则输出0。用数学式表达的话就如下图所示。

听起来很玄乎的感知机其实就是这么简单个东西。惊喜不惊喜，意外不意外。那么这个东西到底有什么用，和深度学习又有什么关系呢？我们再举个例子。就比如五一假期，因为疫情你打算宅在家里哪也不去的时候，你却收到了两个去玩的邀约。一个来自你的好兄弟，一个来自你的女神。这时候你就相当于一个感知机，好兄弟的邀请就相当于一个输入信号（比如x1），女神的邀约就相当于另一个输入信号(x2)，他们各自有一个权重值，也可以理解为对你的诱惑值w1和w2,而你出去玩还是宅家里的临界值就是θ。那么你这个感知机是怎么工作的呢？你的兄弟给你打了一个小时电话来说服你去玩，那么他的输入信号就很强烈，也就是x1很大，但是因为他的权重很小（w1很小），如果你出去玩的阈值θ很高的话，那么估计他口水说干你都不会出去玩，也就是 (w1*x1+w2*x2)<=θ。相反女神给你发了一条微信，只一个字”玩”。虽然输入信号很弱（x2很小），但是因为她在你心里分量很重（w2很大），所以你就屁颠屁颠的出去玩了，也就是(w1*x1+w2*x2)>θ。其实神经网络就是很多个感知机组合在一起，接受外界的输入信号，然后通过不断的自我学习纠错，最终找到这些输入信号之间的规律的一个模型。而这个学习→纠错→再学习→再纠错过程就是深度学习。

微信公众号：DeepVisionZero

最新文章