Skip to content

基于ResNet50的全卷积图像分类,采用Cifar10数据集

Notifications You must be signed in to change notification settings

Feng1909/ResNet50-FCN

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

ResNet50-FCN

论文地址:https://arxiv.org/abs/1411.4038
运行地址:https://aistudio.baidu.com/aistudio/projectdetail/4207287?contributionType=1

FCN:Fully Convolutional Networks

全卷积模型:本项目将CNN模式后面的全连接层换成卷积层,所以整个网络都是卷积层。其最后输出的是一张已经标记好的热图,而不是一个概率值。 通常的CNN网络中,在最后都会有几层全连接网络来融合特征信息,然后再对融合后的特征信息进行softmax分类,如下图所示:

假设最后一层的feature_map的大小是7x7x512,那么全连接层做的事就是用4096个7x7x512的滤波器去卷积这个最后的feature_map。所以可想而知这个参数量是很大的!!

但是全卷积网络就简单多了。FCN的做法是将最后的全连接层替换为4096个1x1x512卷积核,所以最后得出来的就是一个二维的图像,然后再对这个二维图像进行上采样(反卷积),然后再对最后反卷积的图像的每个像素点进行softmax分类。
我们都知道卷积层后的全连接目的是将 卷积输出的二维特征图(feature map)转化成($N\times 1$)一维的一个向量因为传统的卷积神经网络的输出都是分类(一般都是一个概率值),也就是几个类别的概率甚至就是一个类别号,那么全连接层就是高度提纯的特征了,方便交给最后的分类器或者回归。
根据全连接的目的,我们完全可以利用卷积层代替全连接层,在输入端使用 $M\times M$ 大小的卷积核将数据“扁平化处理”,在使用 $1\times 1$ 卷积核对数据进行降维操作,最终卷积核的通道数即是我们预测数据的维度。这样在输入端不将数据进行扁平化处理,还可以使得图片保留其空间信息:

使用全卷积层的优点:

  • 全卷积层能够兼容不同大小的尺寸输入。
  • 与global avg pooling类似,可以大大减少网络参数量

数据集介绍:Cifar10

链接:http://www.cs.toronto.edu/~kriz/cifar.html

CIFAR-10是一个更接近普适物体的彩色图像数据集。CIFAR-10 是由Hinton 的学生Alex Krizhevsky 和Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。一共包含10 个类别RGB彩色图片:飞机(airplane)、汽车(automobile)、鸟类(bird)、(cat)、鹿(deer)、(dog)、蛙类(frog)、(horse)、(ship)和卡车(truck).

每个图片的尺寸为$32\times 32$,每个类别有6000个图像,数据集中一共有50000张训练图片和10000张测试图片。

About

基于ResNet50的全卷积图像分类,采用Cifar10数据集

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published