BaseLine应该还是是FPN。物体检测的网络结构现在的研究还是比较弱的。语义分割相比之下很成熟。“强语义+强位置+强上下文”这个点要从语义分割借鉴过来。
image.png《DSFD》中的dilation-conv那一块作用相当于一个ASPP,“强语义+强上下文”。
image.png
《ThunderNet》中“强语义+强上下文”的另外一种方式。
ref:
DSFD: Dual Shot Face Detector
ThunderNet: Towards Real-time Generic Object Detection
网友评论