真他妈的难
Directory
看到脑门疼,存了5$打印出来看,周六要交一个report
这篇文章讲的很好。卷积神经网络(CNN):图像级语义理解的利器
全卷积神经网络(FCN)是基于CNN提出的一种新方法。通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量。通常适合于图像级的__分类__和__回归__任务。即最终的输出都表示为数值class score。
与物体分类要建立图像级理解任务不同的是,有些应用场景下要得到图像像素级别的分类结果,例如:
-
语义级别图像分割(semantic image segmentation), 最终要得到对应位置每个像素的分类结果。其目的是将图像分割为若干个区域, 使得语义相同的像素被分割在同意区域内。
-
边缘检测, 相当于对每个像素做一次二分类(是边缘或不是边缘)。这个很常见。
FCN进行像素级的分类来解决semantic segmentation问题。FCN能够端到端(end to end)得到每个像素的预测结果。他可以接受任意大小的输入图像,采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测, 同时也保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。
还有一篇blog,讲的是对论文的理解也值得一看论文笔记《Fully Convolutional Networks for Semantic Segmentation》
上一篇 从神经网络到卷积神经网络的了解
下一篇 毕业季求职