码迷,mamicode.com
首页 > 其他好文 > 详细

性能分析工具初试

时间:2019-06-28 20:56:58      阅读:105      评论:0      收藏:0      [点我收藏+]

标签:win   too   vat   步骤   loaded   调用   clock   文件拷贝   test   

性能分析工具小试

说明:想快速知道程序哪里比较耗时,但是又不想在每个函数或者诸多代码块加时间统计。最近两天尝试了以下工具。

1. perf

1.1 安装

sudo yum install perf*

注:这个也可以用源码安装,比如我系统目录:/usr/src/kernels/3.10.0-862.el7.x86_64/tools/perf 这里边直接带有perf

1.2 使用

首先编译debug版程序,比如编译了test程序,然后使用如下命令

perf record -g -e cpu-clock ./test test_parm1

这时候程序正常结束的会自动生成perf.data 文件。这个文件还是需要借助perf来看,如下

perf report

内容大概如下:

  • 技术图片

1.3 总结

从上图可以看清楚时间主要消耗在哪里,不过perf看起来还是不够清楚,而且函数调用不够深(我没仔细研究,可能还有其它参数设置。)

2.valgrind

2.1 安装

可以去valgrind 官网 http://valgrind.org/downloads/current.html 下载,安装步骤可以看REDME,安装很方便,我当时没出问题。

2.2 使用

这里只操作生成调用关系图,tool还包含内存检查等其它组件,具体使用可以查资料。

例如:我有如下带参数的siggle-main程序,使用以下命令,当程序正常退出时可以生成callgrind.out.xxx文件:

valgrind --tool=callgrind ./bin/single-main ./models/ ./data/wav_list.txt test.out

此文件拷贝到windows平台然后借助图形工具kcachegrind 打开,去官网下载:http://kcachegrind.sourceforge.net/html/Download.html

打开内容如下,函数调用,时间消耗清晰明了:

技术图片

2.3 总结

实际还试了gprof工具,感觉还是valgrind用起来方便,主要函数调用关系它画的很深,突然觉得这下借助来看kaldi源码会很方便,哈哈。

性能分析工具初试

标签:win   too   vat   步骤   loaded   调用   clock   文件拷贝   test   

原文地址:https://www.cnblogs.com/tenxi/p/11104536.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!