建站排名,网页的制作方法,建设通网站是筑龙网的吗,wordpress仿主题data augmentation/spacial transformer
CNN 并不能够处理影像放大缩小,或者是旋转的问题。所以在做影像辨识的时候,往往都要做 Data Augmentation#xff0c;把你的训练数据截一小块出来放大缩小、把图片旋转#xff0c;CNN 才会做到好的结果。
有一个架构叫 spacial Tran…data augmentation/spacial transformer
CNN 并不能够处理影像放大缩小,或者是旋转的问题。所以在做影像辨识的时候,往往都要做 Data Augmentation把你的训练数据截一小块出来放大缩小、把图片旋转CNN 才会做到好的结果。
有一个架构叫 spacial Transformer Layer可以处理。 设计一个层需要的地方1不要的地方0 经过一个NNFP发生平移 还可以放大或缩小只需要改变参数 旋转一共需要6个参数 当6个参数全部设定的是整数时结果比较好处理 但如果是小数时呢通过最终答案的四舍五入得到结果。但此时梯度也不好计算。
可以这样假设假设最终结果发生一些微小的变化四舍五入后得到的结果是一样的这就说明梯度几乎0 使用插值方法代替四舍五入
最终结果与周围四个值都有关。此时输出值的变化时刻影响最终结果。 把ST看成橙色它可以放在很多地方。 这个视频的含义是改变一些输入后变大 变小 左右旋转经过ST层输出结果基本不变。 实例
这里用了single ST和multi ST效果有些变化 这个例子用了2层和4层的ST输入图片有两种大小规格。
2层的是只识别鸟嘴和鸟翼4层还识别了其他地方。