当前位置:首页 > Web开发 > 正文

更大的卷积核也符合light head rcnn中得到的结论的

2024-03-31 Web开发

知乎上看到一篇博客https://zhuanlan.zhihu.com/p/99766566,讨论cnn中位置信息是如何学到的,觉得挺有意思的,就看了一下原文,

简单记录一下几个尝试部分。

1、位置信息来自预训练模型

 作者分袂用预训练权重的vgg,resnet和posenet来比拟,发明用了预训练权重的vgg和resnet提取的位置信息更准确。但这个尝试我

感受设计的不同理,真正比拟尝试应该设计的是,用预训练权重的vgg,resnet比拟随机初始化的vgg,resnet,而不是和单层的posnet来比拟

2、大的卷积核和更多的层数,能获得更准确的位置信息

    更多的层数就不用说了,更大的卷积核也切合light head rcnn中得到的结论的,在某层中使用大的卷积核,效果更好。

3、位置信息存放在那一层

   原文分袂用5层特征来比拟,最后发明越深的特征,功效越准确。

4、位置信息来自哪里

 这篇文章的核心,,作者认为来自于padding,并设计了几组比拟尝试(包孕检测支解任务):加padding的准确率比不加的准确率要高很多。

  

How much Position Information Do Convolutional Neural Networks Encode?

温馨提示: 本文由Jm博客推荐,转载请保留链接: https://www.jmwww.net/file/web/30869.html