top of page
アンカー 1

一、前言

要想跑需要先学会走,任何复杂技术的背后其实都是依赖像1+1=2这样简单的理论来支撑的,所以基础很枯燥但也重要。 二、深度学习(DeepLearning) 人工智能现在已经慢慢的深入我们的生活之中。比如人脸识别,语音翻译,自动驾驶等等。环顾我们四周,以前一部分只有人可以做到的事情,现在人工智能也能做,甚至做的比人类更好。然而这么牛X的东西背后都有哪些技术呢?不知道没关系,因为我也不知道。但是我知道这其中有一项很很很重要的技术就是【深度学习】。 什么是深度学习?怎么实现?那你问对人了。小的不才,略懂一二。 首先什么深度学习。生硬的理论知识我就不讲了,也不会讲。咱就举个通俗易懂的例子。 比如小朋友学习认识数字1。你在黑板上画一道竖线告诉她,这是数字1,她记住了。那么你再画一道横线问她,她也许会不假思索的回答1,因为在她的认知里,一个短线就是1,管它横的竖的。这时候如果你告诉她错了,1应该大概是一根竖线,这样子她就学会了。为什么呢?因为她找到了数字1的特征或者说是规律(一根竖线,大体上是直线)。其实这就是一个简单的深度学习。通过从一堆看似很杂乱的数据里找到特征,规律,然后利用这些特征去认知一些新的东西。 那么深度学习是怎么实现的?答案便是神经网络。 三、神经网络

又是一个新名词,其实神经网络就是通过计算机模拟人的神经的工作方式的一种模型。是不是很神奇,很牛X。有时候不得不佩服那些满脑子奇思妙想的人,人类的发展就是靠这些牛人推动的。 言归正传,今天的主题便是神经网络的最小单元:感知机(perceptron)。如下图所示

感知机就是一个有多个输入信号,一个输出信号的模型。如上图所示,x1,x2就是输入信号,y是输出信号,w1,w2是权重(weight)(后面会说明什么是权重),每一个圆圈代表一个神经元。输入信号通过神经元传送的时候,先对各自的权重进行乘法计算,然后再求和(x1*w1+x2*w2)。如果这个和大于某个预先设定的临界值(阈值θ)的话就输出1,否则输出0。用数学式表达的话就如下图所示。

听起来很玄乎的感知机其实就是这么简单个东西。惊喜不惊喜,意外不意外。那么这个东西到底有什么用,和深度学习又有什么关系呢?我们再举个例子。 就比如五一假期,因为疫情你打算宅在家里哪也不去的时候,你却收到了两个去玩的邀约。一个来自你的好兄弟,一个来自你的女神。这时候你就相当于一个感知机,好兄弟的邀请就相当于一个输入信号(比如x1),女神的邀约就相当于另一个输入信号(x2),他们各自有一个权重值,也可以理解为对你的诱惑值w1和w2,而你出去玩还是宅家里的临界值就是θ。那么你这个感知机是怎么工作的呢? 你的兄弟给你打了一个小时电话来说服你去玩,那么他的输入信号就很强烈,也就是x1很大,但是因为他的权重很小(w1很小),如果你出去玩的阈值θ很高的话,那么估计他口水说干你都不会出去玩,也就是 (w1*x1+w2*x2)<=θ。 相反女神给你发了一条微信,只一个字”玩”。虽然输入信号很弱(x2很小),但是因为她在你心里分量很重(w2很大),所以你就屁颠屁颠的出去玩了,也就是(w1*x1+w2*x2)>θ。 其实神经网络就是很多个感知机组合在一起,接受外界的输入信号,然后通过不断的自我学习纠错,最终找到这些输入信号之间的规律的一个模型。而这个学习→纠错→再学习→再纠错过程就是深度学习。

微信公众号:DeepVisionZero

bottom of page