美文网首页
perf查看检测相关性能

perf查看检测相关性能

作者: pandazhong | 来源:发表于2018-11-03 20:02 被阅读0次

    启动程序:./detectTest -p ./1080P -m ./eagle -t 30 -c 100000

    perf stat统计结果如下:

    其他指标均正常,除了CPI,每周期执行了0.67条指令。

    怀疑时CPU的IO导致,查看CPU缓存:

    执行如下指令: perf stat -e instructions -e cache-references -e cache-misses -e L1-dcache-loads -e L1-dcache-load-misses -e L1-dcache-stores -e L1-dcache-store-misses -e LLC-loads -e LLC-load-misses -e LLC-prefetches -e cycles -e cs -p 36232

    输出如下:

    从以上输出可知,L1D和LLC的misses偏高,为CPU IO密集型的计算。

    多次测试结果表明,在Xone E5 2680型号的CPU上,每张图片检测大约需要0.7s左右。

    附加:

    在使用了taskset之后,性能有略微的提升.

    numactl输出如下:

    限制程序跑在0-35的线程:

    程序输出如下:

    平均检测时间比之前降低了10ms左右,看下perf的统计输出:

    每周期执行的指令数,L1D,LLC命中率都略微提升。

    相关文章

      网友评论

          本文标题:perf查看检测相关性能

          本文链接:https://www.haomeiwen.com/subject/rpclxqtx.html