Tower Memo

只记吃喝玩乐,不写技术博客

语义分割论文阅读

Segnet for semantic segmantation

FCN & SegNet & U-Net 语义分割大多数方法都是基于FCN改进的 Review FCN 全连接->卷积 任意输入 softmax 逐像素预测类别 Deconv 上采样 centor crop + skip +逐像素相加 融合语义和细节特征 Segnet A Deep Convolutional Encode...

端到端文本识别论文阅读

Deep Text Spotter

An End-to-End Trainable Scene Text Localization and Recognition Framework Baseline: Yolo v2 + RPN + STN + RNN +CTC Yolo v2 backbone 使用yolo v2前18层卷积和5个池化,去掉全连接层,得到全卷积网络 ...

目标检测论文阅读

Scale Normalization for Image Pyramid

An Analysis of Scale Invariance in Object Detection - SNIP 0. Introduction 目标检测中的矛盾 分类网络的位置不变性: 对分类任务而言,希望网络随着某个目标在图像中移动,无论移动到哪里都依然可以准确的区分为对应的类别,实验表明,深的全卷积网络能够具备这个特性,比如Res...

文本检测论文阅读

Rotation-Sensitive Regression for Oriented Scene Text Detection

Keypoints 关键点 对分类和回归使用由不同结构的网络分支提取出的不同的特征, (其他方法对于两个任务使用共享特征,而任务的不兼容性使得表现退化) 回归分支通过旋转卷积核来提取对旋转敏感的特征,位置检测更精确 分类分支通过下采样旋转敏感特征提取旋转不变的特征,文本判断更准确 (想法可以几乎无损速度的情况下嵌入其他的检测网络中使用) ...

Caffe源码

自定义Caffe层并编译

Mask R-CNN在源码中添加ROI Align层 RoI ( Region of Interest ), 即为原图中的Region Proposals映射到特征图( feature map )上的框。Fast R-CNN中首次提出的ROI Pooling,由于在下采样过程中两次取整量化的操作,使得RoI有些许的位置偏差。因而在Mask R-CNN中提出了ROI Align,通过使用双线...

射影变换

IP2空间的图像校正与模拟贴图

======== 2018 新 年 分 割 线 ======== 为了加快自己写周总结的速度,只能刻意练习了╮(╯▽╰)╭ 射影变换 由照相机的小孔成像原理,当成像平面与所摄物体所在平面不平行时,产生的就是IP2中的射影变换。 二维射影平面内的一切射影变换本质都为3x3可逆阵,同时考虑到单应性,变换矩阵的自由度为8,只需4组对应点的x,y坐标值即可求。求解变换矩阵时可应用...