- 跨模态检索
(1) 《Stacked Cross Attention for Image-Text Matching》
跨模态检索SCAN
https://zhuanlan.zhihu.com/p/143194374
(2) 《ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks》
跨模态模型VILBERT
https://zhuanlan.zhihu.com/p/143275201
(3) 《FashionBERT: Text and Image Matching with Adaptive Loss for Cross-modal Retrieval》
跨模态商品检索FashionBERT
https://zhuanlan.zhihu.com/p/142885212
(4) 《Composing Text and Image for Image Retrieval - An Empirical Odyssey》
结合文字和图片的图像检索
https://zhuanlan.zhihu.com/p/136401491
(5) 《Show, Attend and Tell: Neural Image CaptionGeneration with Visual Attention》
视觉注意力模型生成图片标题
https://zhuanlan.zhihu.com/p/137825062
(6) 《Cross-Domain Image Retrievalwith Attention Modeling》 使用Attention模型实现交叉领域的图片搜索
https://zhuanlan.zhihu.com/p/137418355
- 图像检索
(1) 《Combination of Multiple Global Descriptors for Image Retrieval》
结合多个全局描述的图像检索
https://zhuanlan.zhihu.com/p/142637820
(2) 《DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations》
在服装识别和检索领域,探讨服装特征和服装关键点及大规模数据库的作用
https://zhuanlan.zhihu.com/p/137944518
(3) 《DeepFashion2: A Versatile Benchmark for Detection, Pose Estimation, Segmentation and Re-Identification of Clothing Images》
DeepFashion2:服装图像检测、姿态估计、分割和再识别的通用基准
https://zhuanlan.zhihu.com/p/138077712
(4) 《Fine-tuning CNN Image Retrieval with No Human Annotation》
无标注的CNN图像检索
https://zhuanlan.zhihu.com/p/137293043
(5) 《End-to-end Learning of Deep Visual Representations for Image Retrieval》
端到端图片检索
https://zhuanlan.zhihu.com/p/136973381
(6) 《PARTICULAR OBJECT RETRIEVAL WITH INTEGRAL MAX-POOLING OF CNN ACTIVATIONS》
使用R-MAC提取局部特征
https://zhuanlan.zhihu.com/p/136676275
(7) 《FashionNet: Personalized Outfit Recommendation with Deep Neural Network》
构建基于深度学习网络的穿搭推荐系统
https://zhuanlan.zhihu.com/p/137697475
- 目标检测
(1) 《Rich feature hierarchies for accurate object detection and semantic segmentation》
用多层特征实现精确目标检测和语义切分R-CNN
https://zhuanlan.zhihu.com/p/138752030
(2) 《Fast R-CNN》
快速的基于区域的卷积神经网络
https://zhuanlan.zhihu.com/p/139050020
(3) 《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》
使用RPN(建议区域网络)的实时物体检测
https://zhuanlan.zhihu.com/p/139261068
(4) 《Fully Convolutional Networks for Semantic Segmentation》
用于语义分割的全卷积网络 FCN
https://zhuanlan.zhihu.com/p/139990770
(5) 《Feature Pyramid Networks for Object Detection》
物体识别中使用特征金字塔网络FPN
https://zhuanlan.zhihu.com/p/139639381
(6) 《Mask R-CNN》
Mask R-CNN实例分割算法
https://zhuanlan.zhihu.com/p/140366464
(7) 《You Only Look Once:Unified, Real-Time Object Detection》
快速目标检测YOLO
https://zhuanlan.zhihu.com/p/140776079
(8) 《MMDetection: Open MMLab Detection Toolbox and Benchmark》
目标检测工具集MMDetection
https://zhuanlan.zhihu.com/p/142381918
- 目标跟踪
(1) 《Fully-Convolutional Siamese Networks for Object Tracking》
目标跟踪SiamFC
https://zhuanlan.zhihu.com/p/141117916
(2) 《SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks》
目标跟踪SiamRPN++
https://zhuanlan.zhihu.com/p/141426165
- 深度学习基础
(1) 《An overview of gradient descent optimization algorithms》
梯度下降优化算法
https://zhuanlan.zhihu.com/p/141866254
(2) 《CBAM: Convolutional Block Attention Module》
在基础网络的Block块中加入Attention机制的方法
https://zhuanlan.zhihu.com/p/138429639
网友评论