某科学のBLOG

与其感慨路难行,不如马上出发


  • 首页

  • 标签

  • 分类

  • 归档

  • 日程表

  • 站点地图

DB:基于可微二值化的实时场景文本检测

发表于 2020-11-12 | 分类于 计算机视觉
字数统计: 340 | 阅读时长 ≈ 10分钟
论文地址:Real-time Scene Text Detection with Differentiable Binarization Github:https://github.com/MhLiao/DB(代码结构很复杂) Structure DB(Differentiable Binariza ...
阅读全文 »

【面试向】Batch Normalization

发表于 2020-11-12 | 分类于 面试
字数统计: 1.6k | 阅读时长 ≈ 60分钟
Q:BN解决了什么问题? 解决两个问题: Internal Covariate Shift:深度神经网络涉及到很多层的叠加,而每一层的参数更新会导致上层的输入数据分布发生变化,通过层层叠加,高层的输入分布变化会非常剧烈,这就使得高层需要不断去重新适应底层的参数更新。 梯度消失:由于之前Sigmoi ...
阅读全文 »

【面试向】IoU和mIoU

发表于 2020-11-03 | 分类于 面试
字数统计: 292 | 阅读时长 ≈ 10分钟
害,要开始正儿八经地准备刷面试题了,今个咱就拿这个IoU开刀。 虽然老夫从来没做过基于检测框的目标检测项目。 Q1:啥是IoU?如何计算IoU? IoU就是交并比嘛,两个框相交的面积除以合并的面积。 定义bbox1, bbox2为两个长度为 4 的数组,用于表示两个检测框左上和右下坐标点。 1234 ...
阅读全文 »

【论文翻译】SRN:使用语义推理网络进行场景文本识别

发表于 2020-10-28 | 分类于 计算机视觉
字数统计: 2.9k | 阅读时长 ≈ 100分钟
论文地址:Towards Accurate Scene Text Recognition with Semantic Reasoning Networks Github:https://github.com/chenjun2hao/SRN.pytorch (非官方) Abstract场景文本图像包含 ...
阅读全文 »

AdaIN:基于适应性实例归一化的实时任意风格迁移

发表于 2020-10-12 | 分类于 计算机视觉
字数统计: 4.4k | 阅读时长 ≈ 150分钟
论文地址:Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization Github:https://github.com/xunhuang1995/AdaIN-style PyTorch版代码:https:// ...
阅读全文 »

SynthText:用于文本定位的自然场景文本合成

发表于 2020-09-28
字数统计: 1.4k | 阅读时长 ≈ 40分钟
SynthText论文地址:Synthetic Data for Text Localisation in Natural Images 本文介绍了一种新的自然图像文本检测方法。该方法主要包括两个方面:首先,一个用于生成文本合成图片(synthetic images of text)的引擎。该引擎 ...
阅读全文 »

Mask TextSpotter v3:基于分割候选框的场景文本识别

发表于 2020-09-03 | 分类于 计算机视觉
字数统计: 2.3k | 阅读时长 ≈ 80分钟
论文地址:Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting Github:https://github.com/MhLiao/MaskTextSpotterV3 Abstract最近检测 ...
阅读全文 »

【论文翻译】MoCo:用于无监督视觉表示学习的动量对比

发表于 2020-09-03 | 分类于 计算机视觉
字数统计: 3k | 阅读时长 ≈ 100分钟
论文地址:Momentum Contrast for Unsupervised Visual Representation Learning Abstract我们提出了动量对比(Momentum Contrast, MoCo)的无监督视觉表示学习。从基于字典查找的对比学习(contrastive l ...
阅读全文 »

Hourglass & CornerNet & CenterNet

发表于 2020-08-11 | 分类于 计算机视觉
字数统计: 1.5k | 阅读时长 ≈ 50分钟
最近get到一个project做停车位检测,参考了几篇论文之后决定用关键点检测的方法,于是顺便读了如下几篇关键点检测相关的神经网络论文。 Hourglass论文链接:Stacked Hourglass Networks for Human Pose Estimation Stacked Hourgl ...
阅读全文 »

SPFCN:全卷积网络实现停车位检测

发表于 2020-08-04 | 分类于 计算机视觉
字数统计: 787 | 阅读时长 ≈ 20分钟
论文:SPFCN: Select and Prune the Fully Convolutional Networks for Real-time Parking Slot Detection Github:https://github.com/tjiiv-cprg/SPFCN-ParkingSlo ...
阅读全文 »
1234…8
Hsaki

Hsaki

橘猫最爱的煎饼狗子!

72 日志
9 分类
97 标签
RSS
GitHub E-Mail Kaggle
0%
© 2021 Hsaki
| Site words total count: 99.9k
本站总访问量次 访问人数 总访问量 次