文章的创新点在于
1.运用了CARFT进行region-proposal的提取
关于CRAFT详见:【CRAFT】Cascade Region-proposal-network
![](https://img.haomeiwen.com/i7394071/eb6600881c06b262.png)
2.在pretrain的时候,分成两类
一是以图片中心分类进行预训练,一是以对象为中心进行预训练
![](https://img.haomeiwen.com/i7394071/9ee2617ffa7b6983.png)
3.GBD-NET的提出 we need not must go deeper,we can use context
不同上下文区域的特征相互验证 Control the flow of message passing
![](https://img.haomeiwen.com/i7394071/a40472bea6574260.png)
网络结构(不同尺度+双向传播与gate开关电路)
![](https://img.haomeiwen.com/i7394071/f9c368f3e922a1d5.png)
![](https://img.haomeiwen.com/i7394071/62ef65452f83292b.png)
4.在VIDEO领域,直接利用GBD net,同时加入以下各种方式,进行优化。
![](https://img.haomeiwen.com/i7394071/979a8eaa77023372.png)
网友评论