范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

通俗易懂的卷积神经网络

  1人工神经网络1.1 神经元
  神经网络由大量的神经元相互连接而成。每个神经元接受线性组合的输入后,最开始只是简单的线性加权,后来给每个神经元加上了非线性的激活函数,从而进行非线性变换后输出。每两个神经元之间的连接代表加权值,称之为权重(weight)。不同的权重和激活函数,则会导致神经网络不同的输出。
  举个手写识别的例子,给定一个未知数字,让神经网络识别是什么数字。此时的神经网络的输入由一组被输入图像的像素所激活的输入神经元所定义。在通过非线性激活函数进行非线性变换后,神经元被激活然后被传递到其他神经元。重复这一过程,直到最后一个输出神经元被激活。从而识别当前数字是什么字。
  神经网络的每个神经元如下
  基本wx + b的形式,其中
  、
  表示输入向量
  、
  为权重,几个输入则意味着有几个权重,即每个输入都被赋予一个权重b为偏置biasg(z) 为激活函数a 为输出
  如果只是上面这样一说,估计以前没接触过的十有八九又必定迷糊了。事实上,上述简单模型可以追溯到20世纪50/60年代的感知器,可以把感知器理解为一个根据不同因素、以及各个因素的重要性程度而做决策的模型。
  举个例子,这周末北京有一草莓音乐节,那去不去呢?决定你是否去有二个因素,这二个因素可以对应二个输入,分别用x1、x2表示。此外,这二个因素对做决策的影响程度不一样,各自的影响程度用权重w1、w2表示。一般来说,音乐节的演唱嘉宾会非常影响你去不去,唱得好的前提下 即便没人陪同都可忍受,但如果唱得不好还不如你上台唱呢。所以,我们可以如下表示:
  :是否有喜欢的演唱嘉宾。
  = 1 你喜欢这些嘉宾,
  = 0 你不喜欢这些嘉宾。嘉宾因素的权重
  = 7
  :是否有人陪你同去。
  = 1 有人陪你同去,
  = 0 没人陪你同去。是否有人陪同的权重
  = 3。
  这样,咱们的决策模型便建立起来了:g(z) = g(
  *
  +
  *
  + b ),g表示激活函数,这里的b可以理解成 为更好达到目标而做调整的偏置项。
  一开始为了简单,人们把激活函数定义成一个线性函数,即对于结果做一个线性变化,比如一个简单的线性激活函数是g(z) = z,输出都是输入的线性变换。后来实际应用中发现,线性激活函数太过局限,于是人们引入了非线性激活函数。1.2 激活函数
  常用的非线性激活函数有sigmoid、tanh、relu等等,前两者sigmoid/tanh比较常见于全连接层,后者relu常见于卷积层。这里先简要介绍下最基础的sigmoid函数。
  sigmoid的函数表达式如下
  其中z是一个线性组合,比如z可以等于:b +
  *
  +
  *
  。通过代入很大的正数或很小的负数到g(z)函数中可知,其结果趋近于0或1。
  因此,sigmoid函数g(z)的图形表示如下( 横轴表示定义域z,纵轴表示值域g(z) ):
  也就是说,sigmoid函数的功能是相当于把一个实数压缩至0到1之间。当z是非常大的正数时,g(z)会趋近于1,而z是非常小的负数时,则g(z)会趋近于0。
  压缩至0到1有何用处呢?用处是这样一来便可以把激活函数看作一种"分类的概率",比如激活函数的输出为0.9的话便可以解释为90%的概率为正样本。
  举个例子,如下图(图引自Stanford机器学习公开课)
  z = b +
  *
  +
  *
  ,其中b为偏置项 假定取-30,
  、
  都取为20
  如果
  = 0
  = 0,则z = -30,g(z) = 1/( 1 + e^-z )趋近于0。此外,从上图sigmoid函数的图形上也可以看出,当z=-30的时候,g(z)的值趋近于0如果
  = 0
  = 1,或
  =1
  = 0,则z = b +
  *
  +
  *
  = -30 + 20 = -10,同样,g(z)的值趋近于0如果
  = 1
  = 1,则z = b +
  *
  +
  *
  = -30 + 20*1 + 20*1 = 10,此时,g(z)趋近于1。
  换言之,只有
  和
  都取1的时候,g(z)→1,判定为正样本;
  或
  取0的时候,g(z)→0,判定为负样本,如此达到分类的目的。
  1.3 神经网络
  将下图的这种单个神经元
  组织在一起,便形成了神经网络。下图便是一个三层神经网络结构
  上图中最左边的原始输入信息称之为输入层,最右边的神经元称之为输出层(上图中输出层只有一个神经元),中间的叫隐藏层。
  啥叫输入层、输出层、隐藏层呢?输入层(Input layer),众多神经元(Neuron)接受大量非线形输入讯息。输入的讯息称为输入向量。输出层(Output layer),讯息在神经元链接中传输、分析、权衡,形成输出结果。输出的讯息称为输出向量。隐藏层(Hidden layer),简称"隐层",是输入层和输出层之间众多神经元和链接组成的各个层面。如果有多个隐藏层,则意味着多个激活函数。
  同时,每一层都可能由单个或多个神经元组成,每一层的输出将会作为下一层的输入数据。比如下图中间隐藏层来说,隐藏层的3个神经元a1、a2、a3皆各自接受来自多个不同权重的输入(因为有x1、x2、x3这三个输入,所以a1 a2 a3都会接受x1 x2 x3各自分别赋予的权重,即几个输入则几个权重),接着,a1、a2、a3又在自身各自不同权重的影响下 成为的输出层的输入,最终由输出层输出最终结果。
  上图(图引自Stanford机器学习公开课)中
  表示第j层第i个单元的激活函数/神经元
  表示从第j层映射到第j+1层的控制函数的权重矩阵
  此外,输入层和隐藏层都存在一个偏置(bias unit),所以上图中也增加了偏置项:x0、a0。针对上图,有如下公式
  此外,上文中讲的都是一层隐藏层,但实际中也有多层隐藏层的,即输入层和输出层中间夹着数层隐藏层,层和层之间是全连接的结构,同一层的神经元之间没有连接。
  2 卷积神经网络之层级结构
  cs231n课程里给出了卷积神经网络各个层级结构,如下图
  上图中CNN要做的事情是:给定一张图片,是车还是马未知,是什么车也未知,现在需要模型判断这张图片里具体是一个什么东西,总之输出一个结果:如果是车 那是什么车
  所以最左边是数据输入层,对数据做一些处理,比如去均值(把输入数据各个维度都中心化为0,避免数据过多偏差,影响训练效果)、归一化(把所有的数据都归一到同样的范围)、PCA/白化等等。CNN只对训练集做"去均值"这一步。
  中间是CONV:卷积计算层,线性乘积 求和。RELU:激励层,上文2.2节中有提到:ReLU是激活函数的一种。POOL:池化层,简言之,即取区域平均或最大。
  最右边是FC:全连接层
  这几个部分中,卷积计算层是CNN的核心,下文将重点阐述。3 CNN之卷积计算层3.1 CNN怎么进行识别
  当我们给定一个"X"的图案,计算机怎么识别这个图案就是"X"呢?一个可能的办法就是计算机存储一张标准的"X"图案,然后把需要识别的未知图案跟标准"X"图案进行比对,如果二者一致,则判定未知图案即是一个"X"图案。
  而且即便未知图案可能有一些平移或稍稍变形,依然能辨别出它是一个X图案。如此,CNN是把未知图案和标准X图案一个局部一个局部的对比,如下图所示
  作者:七月在线 七仔
  链接:https://zhuanlan.zhihu.com/p/36424985
  来源:知乎
  著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
  而未知图案的局部和标准X图案的局部一个一个比对时的计算过程,便是卷积操作。卷积计算结果为1表示匹配,否则不匹配。
  接下来,我们来了解下什么是卷积操作。
  3.2 什么是卷积
  对图像(不同的数据窗口数据)和滤波矩阵(一组固定的权重:因为每个神经元的多个权重固定,所以又可以看做一个恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作,也是卷积神经网络的名字来源。
  非严格意义上来讲,下图中红框框起来的部分便可以理解为一个滤波器,即带着一组固定权重的神经元。多个滤波器叠加便成了卷积层。
  举个具体的例子。比如下图中,图中左边部分是原始输入数据,图中中间部分是滤波器filter,图中右边是输出的新的二维数据。
  分解下上图
  对应位置上是数字先相乘后相加
  =
  中间滤波器filter与数据窗口做内积,其具体计算过程则是:4*0 + 0*0 + 0*0 + 0*0 + 0*1 + 0*1 + 0*0 + 0*1 + -4*2 = -8
  3.3 图像上的卷积
  在下图对应的计算过程中,输入是一定区域大小(width*height)的数据,和滤波器filter(带着一组固定权重的神经元)做内积后等到新的二维数据。
  具体来说,左边是图像输入,中间部分就是滤波器filter(带着一组固定权重的神经元),不同的滤波器filter会得到不同的输出数据,比如颜色深浅、轮廓。相当于如果想提取图像的不同特征,则用不同的滤波器filter,提取想要的关于图像的特定信息:颜色深浅或轮廓。
  如下图所示
  3.4 GIF动态卷积图
  在CNN中,滤波器filter(带着一组固定权重的神经元)对局部输入数据进行卷积计算。每计算完一个数据窗口内的局部数据后,数据窗口不断平移滑动,直到计算完所有数据。这个过程中,有这么几个参数:
  a. 深度depth:神经元个数,决定输出的depth厚度。同时代表滤波器个数。
  b. 步长stride:决定滑动多少步可以到边缘。
  c. 填充值zero-padding:在外围边缘补充若干圈0,方便从初始位置以步长为单位可以刚好滑倒末尾位置,通俗地讲就是为了总长能被步长整除。
  cs231n课程中有一张卷积动图,貌似是用d3js 和一个util 画的,我根据cs231n的卷积动图依次截取了18张图,然后用一gif 制图工具制作了一gif 动态卷积图。如下gif 图所示
  可以看到:两个神经元,即depth=2,意味着有两个滤波器。数据窗口每次移动两个步长取3*3的局部数据,即stride=2。zero-padding=1。
  然后分别以两个滤波器filter为轴滑动数组进行卷积计算,得到两组不同的结果。
  如果初看上图,可能不一定能立马理解啥意思,但结合上文的内容后,理解这个动图已经不是很困难的事情:左边是输入(7*7*3中,7*7代表图像的像素/长宽,3代表R、G、B 三个颜色通道)中间部分是两个不同的滤波器Filter w0、Filter w1最右边则是两个不同的输出
  随着左边数据窗口的平移滑动,滤波器Filter w0 / Filter w1对不同的局部数据进行卷积计算。
  值得一提的是:
  1.左边数据在变化,每次滤波器都是针对某一局部的数据窗口进行卷积,这就是所谓的CNN中的局部感知机制。
  打个比方,滤波器就像一双眼睛,人类视角有限,一眼望去,只能看到这世界的局部。如果一眼就看到全世界,你会累死,而且一下子接受全世界所有信息,你大脑接收不过来。当然,即便是看局部,针对局部里的信息人类双眼也是有偏重、偏好的。比如看美女,对脸、胸、腿是重点关注,所以这3个输入的权重相对较大。
  2.与此同时,数据窗口滑动,导致输入在变化,但中间滤波器Filter w0的权重(即每个神经元连接数据窗口的权重)是固定不变的,这个权重不变即所谓的CNN中的参数(权重)共享机制。
  再打个比方,某人环游全世界,所看到的信息在变,但采集信息的双眼不变。btw,不同人的双眼 看同一个局部信息 所感受到的不同,即一千个读者有一千个哈姆雷特,所以不同的滤波器 就像不同的双眼,不同的人有着不同的反馈结果。
  我第一次看到上面这个动态图的时候,只觉得很炫,另外就是据说计算过程是"相乘后相加",但到底具体是个怎么相乘后相加的计算过程 则无法一眼看出,网上也没有一目了然的计算过程。本文来细究下。
  首先,我们来分解下上述动图,如下图
  接着,我们细究下上图的具体计算过程。即上图中的输出结果1具体是怎么计算得到的呢?其实,类似wx + b,w对应滤波器Filter w0,x对应不同的数据窗口,b对应Bias b0,相当于滤波器Filter w0与一个个数据窗口相乘再求和后,最后加上Bias b0得到输出结果1,如下过程所示:
  1* 0 + 1*0 + -1*0 +-1*0 + 0*0 + 1*1+-1*0 + -1*0 + 0*1+
  -1*0 + 0*0 + -1*0+0*0 + 0*1 + -1*1+1*0 + -1*0 + 0*2+
  0*0 + 1*0 + 0*0+1*0 + 0*2 + 1*0+0*0 + -1*0 + 1*0+
  1=1
  然后滤波器Filter w0固定不变,数据窗口向右移动2步,继续做内积计算,得到0的输出结果
  最后,换做另外一个不同的滤波器Filter w1、不同的偏置Bias b1,再跟图中最左边的数据窗口做卷积,可得到另外一个不同的输出。
  4 CNN之激励层与池化层4.1 ReLU激励层
  1.2节介绍了激活函数sigmoid,但实际梯度下降中,sigmoid容易饱和、造成终止梯度传递,且没有0中心化。咋办呢,可以尝试另外一个激活函数:ReLU,其图形表示如下
  ReLU的优点是收敛快,求梯度简单。4.2 池化pool层
  前头说了,池化,简言之,即取区域平均或最大,如下图所示(图引自cs231n)
  上图所展示的是取区域最大,即上图左边部分中 左上角2x2的矩阵中6最大,右上角2x2的矩阵中8最大,左下角2x2的矩阵中3最大,右下角2x2的矩阵中4最大,所以得到上图右边部分的结果:6 8 3 4。很简单不是?

四川酒桌怪象,当地人不喝五粮液,却偏爱这4款,你喝过没?四川酒桌怪象,当地人不喝五粮液,却偏爱这4款,你喝过没?川酒,在中国白酒版图中也占据十分重要的地位。自中国白酒诞生的那天起,白酒便以独特的方式滋润着整个社会,并贯穿在日常生产生活和胎儿肾盂分离是什么?肾盂分离是指肾盂与输尿管的连接部位出现障碍导致肾盂增大,称为肾盂分离。胎儿肾盂分离是胎儿由于肾结石输尿管畸形导致尿液无法正常排出引起肾积水的一种现象。分为生理性和病理性分离,生理性美媒福建舰不是美国的最大问题,另外4款中国舰艇构成更大挑战美媒CNN近日发表文章称,中国海军的新航母福建舰是迄今为止中国最大最现代化的大型常规动力航母,现在的中国海军规模俨然已经是世界第一大海军了。美专家舒斯特认为,中国在电磁弹射系统和其他们的目标俄罗斯黄金中宏网6月27日电据英国天空新闻6月26日报道,英国美国日本和加拿大将牵头七国集团禁止进口俄罗斯黄金。据路透社报道,美国总统拜登和其他七国集团领导人将达成协议,宣布禁止从俄罗斯进口最后一块拼图落地,美国向右急转,谁被打脸抛弃?经常有人说,你咋这么关心美国呢?我要实话实说呢,其实就是因为美国还比较强大,你不关心它,它就会来关心你。我关心它,是看它的发展趋势,寻找它的弱点,这些都是比较直接的。但它来关心我们北约六国部署200枚核弹,俄两型轰炸机空袭基辅,杀手锏还没用俄罗斯是在2月24日发起对于乌克兰的特别军事行动的,这场特别军事行动如今已经持续了4个月时间,能够让俄乌冲突持续至今的重要原因,就是西方国家正在这场冲突中不断的拱火,可以看出西方国7月1日施行!铁路旅客禁止限制携带物品有新变化近日国家铁路局和公安部公布了最新版铁路旅客禁止限制携带和托运物品目录2022年7月1日起施行转发收藏一起看看有哪些变化哪些物品禁止托运和随身携带?哪些物品禁止随身携带但可以托运?随三国知名谋士排名诸葛亮为何仅排第六,看看前五名都是谁就懂了如果说,整个三国时期是一场英雄间的博弈,那么在这个时代下。如果说武将的博弈是一场生死游戏,是个人赌上自己的生死在战场上博取荣耀的话,那么谋士之间的博弈就是一场棋局。一场以天下为棋盘不要战争,不要北约!马德里市中心爆发反北约游行据法新社马德里消息,数以千计的民众26日中午在马德里市中心示威游行,要求解散北约及维护和平。而就在近日,北约峰会即将在这个西班牙的首都举行。报道称,示威者的标语牌写着不要战争,不要一分一段表!山东2022年高考成绩排名出炉,上600分考生有15488人说起山东的教育,一些小伙伴们会想到山东的高等教育,山东本土有山东大学,中国海洋大学,中国石油大学(华东)三所双一流高校,其中前两所还是985大学。其实呢,山东的高等教育不错,基础教德云社又爆性丑闻,郭德纲真的慌了德云社又出事了,因为性丑闻登上了热搜。遭到网友的集体攻讦,被喷得体无完肤。这次舆论祸乱又是徒弟引起的。昨晚11点钟,有博主爆料,一名女生遭到了德云社相声演员陈霄华的猥亵和企图强奸。
为什么共享充电宝的使用费越来越贵,反而没赚到什么钱?亏损扩大为什么共享充电宝的使用费越来越贵,反而没赚到什么钱?高度依赖人流量?营收下滑亏损扩大2014年伴随共享经济浪潮诞生的共享充电宝,到2016年进入爆发期。令人感到奇怪的是,如今的消费支付宝微信可以信用卡取现了,目前支持这三家银行华夏时报(www。chinatimes。net。cn)记者傅碧霄北京报道近日,有用户发现,支付宝和微信新上线了信用卡取现功能,用户可以在这些平台上从自己的信用卡额度里支取现金,转到无期迷途平均46练度通关了纪念一下作者NGALawlietCJ在拿到1枷锁nox的前一个晚上通关了。我这阵容其实也不是很强,命都是安柏给的8张图的全场mvp。主要压力来自于抽卡总数低,导致我的普卡战神枷锁数偏低,后想了解静脉曲张,看我这一篇文章你就明白了很多患者都有静脉曲张的问题,但是什么是静脉曲张?平时该怎么预防?有什么好的建议吗?今天看我这一篇文章让你明白?问什么是静脉曲张?答静脉曲张属于很严重的病情,它是因为劳力过度再受风寒早起空腹一杯水,究竟养生还是伤身?不刷牙喝水会致病?一文科普如果你喜欢看各种各样有关养生预防心脑血管病的知识,应该都知道晨起一杯水这个养生概念。所谓晨起一杯水,指的就是各位在起床之后,先空腹喝一杯温开水。养生专家认为这能起到稀释粘稠血液促进涨知识了,原来这些都不是真的今天太热啦急需一杯冰水解渴!不行凉的对胃不好我给你倒杯热的去晚上手机放床头我心里才踏实手机千万别放床头你不知道手机有辐射还致癌啊妈,我想吃个苹果没吃饭呢吃啥苹果不能空腹吃你忘了?她震荡行情,猛跌三天必补仓抄底一财经要闻1五部门联合发文6大行动助力电力装备十领域低碳发展2巴菲特卖了超600万股!相守14年来首次减持比亚迪豪赚超30倍!二投顾观点上证指数依旧还是反复震荡,行情进入磨人阶段,提前还房贷划算吗?作为一个从业房地产行业超15年的资深专业人员建议记住,你这辈子能借到最便宜的资金就是房贷。头十年,房子绝对是最优质的投资后十年,房子还是优质的投资之一一旦你提前还清,意味着这辈子你名人堂入选者之蒂姆哈达威胯下变向引领初代跑轰9月11日(本周日)早710点,一年一度的奈史密斯篮球名人堂典礼就要在美国马萨诸塞州举行。在本届名人堂入选者的名单中,有一位入选者堪称胯下变向运球教父,那就是蒂姆哈达威。蒂姆哈达威周总理临终前提出三个要求,邓小平我不同意,人民也不会同意1976一月五日,周总理结束了最后一场手术,被送入了病房。手术后的周总理一直处于昏迷状态,直到两天后才醒来。醒来的周总理看到前来探望的邓颖超,他嘴里发出呜呜的声音。邓大姐握住他的手不管有钱没钱,不要去这3种人家里串门,这才是真正的高情商国人普通喜欢热闹,加上现在生活节奏快,人们心理压力大,置身于一群人中间,总能暂时排解下一个人的冷清和孤单。大家平时工作太忙,也只有在周末或放假时,才能从繁杂的琐事中抽出身来,去别人