树莓派上实现深度学习目标检测的实践(1/3)
这个现实世界造成了很多挑战,比如数据有限、只有微型的计算机硬件(像手机、树莓派)所造成的无法运行复杂深度学习模型等。这篇文章演示了如何使用树莓派来进行目标检测。就像路上行驶的汽车,冰箱里的橘子,文件上的签名和太空中的特斯拉。
image
01.为什么是目标检测?为什么是树莓派?
树莓派是一款灵活的计算机硬件,它以1500万台的销量已经吸引了一代消费者的心,并且黑客们也在树莓派上构建了很多很酷的项目。考虑到深度学习和树莓派相机的的流行,我们认为如果能在树莓派上使用深度学习来检测任意的物体那就非常棒了。
image02.什么是目标检测?
2000万年的进化使得人类的视觉系统有了相当高的进化。人脑有30%的神经元负责处理视觉信息(相对比只有8%处理触觉和3%处理听觉)。与机器相比,人类有两个主要的优势。一是立体视觉,二是训练数据集的供应几乎是无限的(一个五岁的婴儿可以大约在30fps的采样间隔获得2.7B的图像数据)。
image
为了模仿人类水平的表现,科学家将视觉感知任务分解为四个不同的类别。
-
分类,为图像指定一个标签。
-
定位,对特定的标签指定一个边框。
-
物体检测,在图像中绘制多个边框。
-
图像分割,得到物体在图像中的精确位置区域。
物体检测对于很多应用已经足够好(图像分割是更精确的结果,它受到了创建训练数据复杂性的影响。相比于画边框它通常花费人类标注者12倍的时间去分割图像。)此外,在检测物体之后,可以将物体在边框中单独分割出来。
目标检测具有重要的现实意义,已经在各行各业得到了广泛应用。下面列举了一些例子:
image03.怎样使用物体检测解决自己的问题?
-
物体检测可以用于解决各种各样的问题。这些是一个概括的分类:
-
物体是不是出现在我的图像中?比如在我的房子有一个入侵者。
-
在图像中的一个物体在哪个位置?比如一个汽车试图在世界各地导航时,知道物体的位置就很重要。
-
图像中有多少个物体?物体检测是计算物体数目最有效的方法之一。比如仓库的货架上有多少个盒子。
-
图像中有哪些不同类型的物体?比如动物园的哪些区域有哪些动物?
-
物体的尺寸有多大?特别是使用静态的相机,很容易计算出物体的大小。比如芒果的大小是多少。
-
物体之间是如何相互作用的?比如在足球场上的队形是如何影响比赛结果的?
-
物体在不同时间的位置(跟踪一个物体)?比如跟踪一个像火车一样的物体并且计算它的速度。
网友评论