分享
SegNet :索引反池化的轻量分割网络
输入“/”快速插入内容
SegNet :索引反池化的轻量分割网络
飞书用户9071
9月8日修改
【置顶必看】k学长的深度宝典
1、什么是语义分割,什么是FCN
我们提出了一种新颖且实用的深度全卷积神经网络架构,用于语义像素级分割,命名为SegNet。
语义分割是指为图像中的每个像素分配一个类别标签(如道路、天空、汽车),以实现对场景的细粒度理解。
全卷积神经网络(Fully Convolutional Network,简称 FCN)
于2015提出。是深度学习用于语义分割领域的开山之作
,在传统卷积神经网络(CNN)的基础上进行了改进,传统 CNN 主要用于图像分类任务。它的结构通常包括卷积层、池化层和全连接层。在图像分类中,CNN 的输出是一个固定大小的向量(例如,1000 类分类任务的输出向量长度为 1000),表示输入图像属于各个类别的概率分布。
全连接层的输入大小是固定的,这意味着输入图像的大小也必须固定。此外,全连接层的参数量巨大,导致模型复杂度高且难以扩展到像素级任务。
全卷积神经网络的核心思想是将传统 CNN 中的全连接层替换为卷积层,实现对任意大小输入图像的像素级处理。
如fig1所示,全卷积网络先使用卷积神经网络抽取
图像特征
,然后通过卷积层将通道数变换为类别个数,最后再通过转置卷积层将特征图的高和宽变换为输入图像的尺寸。因此,模型输出与输入图像的高和宽相同,且
最终输出通道包含了该空间位置像素的类别预测
。