发现用第一批采集的图像(12000张)随机抽取一小部分(500张)做测试图片集,剩下的做训练图片集(也就是说与测试图片集不重叠),对CNN模型进行训练得到收敛的模型,之后对测试图片集(500张)进行测试,得到准确度等指标,发现可以达到90%以上。
但是实际的效果却并不好,发现模型有很多漏识别的情况。为了验证这一点,又采集了一些图片(更换了新的场景,新的演员,摄像头参数基本一致),约1000张,使用旧的模型,进行测试,发现准确度急剧下降,排除掉一些因素(如摄像头参数【广角,非广角】,距离的远近等因素),准确度只有65%左右。
这是什么原因造成的呢?
因为我们的图片是从连续的视频中一帧一帧(例如,每秒截取一帧的方式)分离出来的,虽然随机抽出的500张图片与剩下的11500张图片没有交集,但是这500张图片必定与11500张图片的某些张图片(这500张的时间序列的前后张)是及其相似的。使用这样的测试集得到的准确率(90%)是不可信的,而实际应该是65%左右,为什么这样低,一方面的由于数据量比较小,另一方面是因为算法的能力。需要进一步改进。
网友评论