基于类别相关性的语义分割方法文献综述

 2022-11-24 22:30:15

语义分割是一种典型的计算机视觉问题,其涉及将一些原始数据(如平面图像)作为输入并将其转换为具有突出显示的感兴趣区域的掩模,图像的每个像素根据其所属的感兴趣对象被分配类别ID

  1. 研究背景:

早期的计算机计算机视觉问题只是发现边缘(线条和曲线)或渐变等元素,但它从未完全按照人类感知的方式提供像素级别的图像理解,因此语义分割应运而生。

(二)传统语义分割方法简介:

传统基于机器学习的图像分割算法,是将输入图像分成若干个特定的、具有独特性质的区域,提取每个区域块的图像特征,如颜色,形状,纹理,边缘等,之后根据一定的规则构建图像特征与高层语义之间的概率图模型,此时模型的参数是未知的,最后通过不断学习的方法确定模型的参数,主要方法有基于阈值的分割方法、基于区域的分割方法和基于边缘检测的分割方法。这些方法的缺点是需要依靠先验知识进行人为选择和设计,耗时耗力,虽然精度较高,但构建的模型鲁棒性较差,很难处理变化。故经常应用在特征变化不大的场合,比如医学图像的分割。

随着深度学习的兴起,传统的语义分割的精度与之相比就相去甚远,但不可否认的是,将传统方法与深度学习相结合是目前语义分割的一个很好的研究突破点。

  1. 当下语义分割研究现状(几类常用的模型):

(1)基于滑窗的语义分割模型:

采取滑窗的方式,取以每个像素点为中心的小图像块(patch)输入CNN来预测该像素点的语义标签,然后将取出的图片送入卷积神经网络中,从而预测出该图片属于哪一类,然后将这个窗口的中心像素打上相应标签,重复这个取窗口和预测的过程,直至所有像素点都被打上了对应的标签。

总结:该模型虽然能比较直观地完成所有像素点的分割过程,但相应的,需要遍历每一个像素点,时间耗费大;此外,窗口的大小也直接影响着语义分割的精度和效率。

(2)基于候选区域的深度语义分割模型:

基于候选区域的语义分割方法首先从图像中提取自由形式的区域并对他们的特征进行描述,然后再基于区域进行分类,最后将基于区域的预测转换为像素级预测,使用包含像素最高得分的区域来标记像素。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。