基于卷积网络的宠物狗脸分类系统的研究文献综述

 2022-08-09 19:45:29


  1. 文献综述
  2. 国内外研究现状

早在1904年,生物学家就了解了神经元的组成结构,神经元通常由几个部分组成,细胞核、树突、轴突、神经末梢,一个神经元有多个树突,用于接收信息;轴突只有一条,用于传导信息;轴突末端有很多神经末梢,可以给其他神经元传递信息;这是生物上的神经元的组成结构。在1943年,心理学家Warren McCulloch和数学家Walter Pits发明了数学意义上的神经元模型,开启了神经网络发展的起点,该神经元模型有很多输入(类比生物神经元的树突),经过加权求和的过程(类比生物神经元的细胞核),通过激活函数(类比生物神经元的轴突),最后给出输出(类比生物神经元的神经末梢),两者非常相似,这么简单的结构并不能解决复杂的问题,但类比人的大脑,当有亿万神经元组合在一起的时候,可以做非常复杂的事情,如果把多个单一的神经元组合在一起,一些神经元的输出做另外一些神经元的输入,这样就形成了神经网络。1958年,Frank Rosenblatt提出了感知机模型,是首个可以学习的单层神经网络,但到了1969年,Marvin Minsky用数学公式证明了只有单层神经网络的感知机是没办法解决异或逻辑等线性不可分问题,要解决线性不可分问题要使用多层神经网络,但由于计算机算力等问题,神经网络的发展停滞了许久。到1986年,Geoffery Hinton提出了反向传播的方法,有效解决了两层神经网络的算力问题。1998年,Yann LeCun提出了LeNet这个神经网络结构,是第一个现代卷积神经网络(Convolutional Neural Network, CNN)。2006年,Geoffery Hinton等人提出深度学习的概念,提出了非监督贪心逐层训练算法,为解决深层次结构的优化难题带来了希望。2012年,卷积神经网络在图像领域出现了惊人的表现,在ImageNet的大型规模视觉识别挑战赛中,Hinton和他的学生Alex Krizhevsky等人设计的深度学习网络AlexNet获得了冠军,AlexNet证明了卷积神经网络在复杂模型下的有效性,推动了有监督深度学习的发展,AlexNet本质上是把LeNet的深度进行了拓展。2014年,牛津大学的视觉几何组(Visual Geometry Group)和Google DeepMind公司的研究员提出了另外一个比较典型的卷积神经网络VGGNet,是ImageNet视觉识别挑战赛的亚军,VGGNet的泛化性能非常好,常用于图像特征的抽取,目标检测候选框生成等等,VGG 最大的问题是参数数量非常多,同年ImageNet比赛的冠军Christian Szegedy提出的GoogLeNet很好解决了这个问题,GoogLeNet使用了名为Inception的网中网的结构,即原来的节点也是网络,保持了网络结构的稀疏性,并保持了模型的计算性能,之前大部分流行的CNN是把卷积层堆叠的越来越多,网络越来越深,而GoogLeNet的宽度和深度都可以扩大,带来较大的性能提升。到2015年,由微软研究院的Kaiming He等四名华人提出的ResNet获得了ImageNet比赛图像分类任务冠军,图像识别分类准确率已经超过了人眼识别的准确率,ResNet采用了跨层连接的方式,它成功的缓解了深层神经网络中的梯度消散问题,为上千层的网络训练提供了可能。2016年由清华大学的Gao Huang, 康奈尔大学的Zhuang Liu等人开发的密集卷积网络DenseNet获得了ImageNet比赛图像分类任务冠军,DenseNet更强化特征传播和特征的复用,对于每一层网络来说,前面所有网络的特征图都被作为输入,同时其特征图也都被后面的网络层作为输入所利用。 2017年是ImageNet图像分类的比赛最后一届,来自Momenta的高级研发工程师胡杰及其所在WMW团队的模型SENet获得冠军,SENet通过学习获取每个特征通道的重要程度,根据重要性去降低或者提升相应的特征通道的权重。

  1. 研究主要成果

卷积网络在多方面有很多成果,在计算机博弈方面,2016年3月,谷歌旗下的DeepMind公司的AlphaGo围棋AI战胜了韩国围棋世界冠军九段棋手李世石,2017年5月AlphaGo围棋AI战胜排名第一的世界围棋冠军柯杰,AlphaGo采用深度卷积神经网络训练策略网络和价值网络,围棋界公认AlphaGo的棋力已经超过人类职业围棋顶尖水平。2017年6月,腾讯在成都的全球合作者大会上表示智能AI“绝艺” 已经投入到了王者荣耀这款游戏中,AI 智能体在 1v1 游戏模式中很有竞争力。2017年8月,特斯拉 CEO 埃隆·马斯克成立的一家非营利公司OpenAI 开发的人工智能单挑Dota世界冠军Dendi ,在10分钟惨败。在探索宇宙发面,2017年12月,美国宇航局(NASA)宣布使用开普勒空间天文望远镜发现了“缩小版”太阳系开普勒-90星系,来自Google AI的工程师Christopher Shallue 利用神经网络技术对开普勒望远镜的数据进行分析,通过卷积神经网络处理了140亿个数据点,接下来,研究人员将继续使用机器学习和更加成熟复杂的计算机算法,在开普勒的数据库中,寻找围绕在约15万颗恒星周围的行星。卷积网络用于语音识别,比如科大讯飞的语音识别技术,用于语音输入,类似的还有阿里天猫精灵、小米小爱同学、苹果公司的Siri、微软的Cortana,继而出现智能客服。深度学习发展的特别好的领域是计算机视觉,创立于北京中关村的人工智能企业旷视科技的人脸识别技术用于城市安防监控,在各大公共场所中监测可疑行为;用于刷脸付款,增加支付的安全性;用于智能门禁,增强出入的安全性。各类图像识别比如由杭州大拿科技股份有限公司新推出的一款识别花卉名为“形色”的APP应用,只要对着植物拍照即可识别植物,可识别4000多种植物。谷歌翻译可以利用手机摄像头对准文字即可实时翻译,解决了不同语言文字的理解障碍。谷歌的微信小程序猜画小歌,用手指绘制草图即可识别画的内容。在图像检索上,谷歌使用基于内容的查询来搜索相关图片,算法分析查询图像中的内容并根据最佳匹配内容返回结果。在医学辅助诊断方面,与英特尔合作的浙江德尚韵兴图像科技有限公司研发出的一套基于超声影像的甲状腺结节良恶性的辅助诊断系统通过计算机视觉的诊断预测疾病,还有x光影像、CT影像、MR影像、病理影像、超声影像等目前用于疾病诊断的各类影像,人工智能系统通过深度学习被标记过的已经具有诊断意见的大量影像案例,来获得智能即分析影像并做出疾病诊断。在无人驾驶方面,百度腾讯阿里都具有无人驾驶技术,无人驾驶中的图像识别技术有交通标志检测、交通灯检测、行人检测等,特别是无人货车,京东、菜鸟已经开始路测。

  1. 发展趋势

卷积网络无监督的深度学习、迁移学习、强化学习这些新的算法越来越受到关注,模型训练时间更短,训练过程更加自动化。未来人工智能需要更多类似的技术。

卷积网络推理与预测功能加强,随着收集的数据量越来越多以及神经网络的发展,推理与预测的准确率会提升,以及达到长时间预测使计算机视觉更加智能化。

卷积网络将能实现多任务。比如在无人驾驶中,对物体的识别、检测、跟踪需要同时进行,才能进行比较好的比如刹车、绕道等场景评估,未来发展是将多重任务结合起来,具有系统级的应用方案。

卷积网络与多个行业融合,具有很好的可推广性和应用性。随着第四次工业革命的到来,人工智能相关技术与工业、商业、服务业、运输业、农业等行业融合,进行复杂的计算机视觉任务分析,推动经济形态演变。

卷积网络与多个学科知识融合,比如脑科学、行为心理学、科学、光谱学、数学等学科,比如生物学上大脑中的学习方式将帮助人们设计更加高效的深度模型。

卷积网络实现多种数据融合分析,比如可见光视觉相机会受到光照、阴影、天气的干扰,因此,多种传感器信息的融合来解决场景感知问题是非常重要的,如激光,雷达,热感应相机等获取的多种数据协同感知,来得到更准确、更充分的场景与环境感知。

  1. 存在的问题

卷积网络很多算法与模型需要标记精准的训练数据,也就是有监督的学习,收集数据需要大量的人力劳动。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。