Tower Memo

只记吃喝玩乐，不写技术博客

语义分割论文阅读

Segnet for semantic segmantation

FCN & SegNet & U-Net 语义分割大多数方法都是基于FCN改进的 Review FCN 全连接->卷积任意输入 softmax 逐像素预测类别 Deconv 上采样 centor crop + skip +逐像素相加融合语义和细节特征 Segnet A Deep Convolutional Encode...

Posted by Tower on November 7, 2018

端到端文本识别论文阅读

Deep Text Spotter

An End-to-End Trainable Scene Text Localization and Recognition Framework Baseline: Yolo v2 + RPN + STN + RNN +CTC Yolo v2 backbone 使用yolo v2前18层卷积和5个池化，去掉全连接层，得到全卷积网络 ...

Posted by Tower on October 31, 2018

目标检测论文阅读

Scale Normalization for Image Pyramid

An Analysis of Scale Invariance in Object Detection - SNIP 0. Introduction 目标检测中的矛盾分类网络的位置不变性：对分类任务而言，希望网络随着某个目标在图像中移动，无论移动到哪里都依然可以准确的区分为对应的类别，实验表明，深的全卷积网络能够具备这个特性，比如Res...

Posted by Tower on May 19, 2018

文本检测论文阅读

Rotation-Sensitive Regression for Oriented Scene Text Detection

Keypoints 关键点对分类和回归使用由不同结构的网络分支提取出的不同的特征，（其他方法对于两个任务使用共享特征，而任务的不兼容性使得表现退化）回归分支通过旋转卷积核来提取对旋转敏感的特征，位置检测更精确分类分支通过下采样旋转敏感特征提取旋转不变的特征，文本判断更准确（想法可以几乎无损速度的情况下嵌入其他的检测网络中使用） ...

Posted by Tower on April 21, 2018

Caffe源码

自定义Caffe层并编译

Mask R-CNN在源码中添加ROI Align层 RoI ( Region of Interest ), 即为原图中的Region Proposals映射到特征图( feature map )上的框。Fast R-CNN中首次提出的ROI Pooling，由于在下采样过程中两次取整量化的操作，使得RoI有些许的位置偏差。因而在Mask R-CNN中提出了ROI Align，通过使用双线...

Posted by Tower on March 15, 2018

射影变换

IP2空间的图像校正与模拟贴图

======== 2018 新年分割线 ======== 为了加快自己写周总结的速度，只能刻意练习了╮(╯▽╰)╭ 射影变换由照相机的小孔成像原理，当成像平面与所摄物体所在平面不平行时，产生的就是IP2中的射影变换。二维射影平面内的一切射影变换本质都为3x3可逆阵，同时考虑到单应性，变换矩阵的自由度为8，只需4组对应点的x,y坐标值即可求。求解变换矩阵时可应用...

Posted by Tower on January 4, 2018

FEATURED TAGS

论文阅读

ABOUT ME

现在当马仔，以后铜锣湾就只有一个塔哥

✉️ 1074347272@qq.com

FRIENDS