标签:profiler 自我心的 debug performance
Visual studio 2010 的Profiler是自带的性能工具, 利用它我们可以找出程序中的性能瓶颈,然后不断优化不断再测试。
Profiler有利用向导启动程序和后期附加到程序两种关联被测模块的方式,测试方式也有两种:Sampling(采样)和Instrumentation(检测)。
Sampling:按设置的时间间隔中断计算机处理器并收集函数调用堆栈。
调用堆栈是一个动态结构,用于存储有关正在处理器上执行的函数的信息。这个分析方法形成的结果就是各个函数在运行时被采样的次数,次数越大代表开销越大。因为对被测源码不需要更改,所以直接启动或者后期附加到被测程序都可以。
Instrumentation:在被测源码文件中目标函数的开始和结尾以及这些函数对其他函数的每次调用前后插入代码。
插入的代码记录了以下信息:
根据”Tools\Options\Performance Tools\“ 下‘Show time values as:’的默认设置为Milliseconds,我觉得采样周期应该是毫秒级,也就是说报告中采样次数可以约等于毫秒。
通过‘Analyze\Launch Performance Wizard…’ 或者‘Analyze\Profiler\Attach or Detach…’对被测程序进行新建Performance Session(性能会话), 我们主要介绍下Sampling通过Attach To Process的情况下报告的分析。
Profiler开始后,类似:
当你觉得已经收集了足够的信息可以停止后, 点击‘Stop profiling’, 类似:
上述界面就是报告的Summary, 我们开始分析程序的性能瓶颈。
‘Hot Path’指的就是采样次数高的,也就是性能瓶颈的函数。
‘Inclusive Samples’指的是该函数整体被采样的次数,说白了,就是函数本身以及它所调用的所有子函数的总共开销大小。
‘Exclusive Samples’指的是该函数本身被采样的次数,说白了,也就是函数自己的开销大小,不包含它所调用的子函数的开始。
通过上述几个介绍,我们就可以从图中得到性能瓶颈的函数, 然后根据Call Tree可以得到完整的调用上下文。
例如,在Summary界面中点击CallTree,按照‘Inclusive Samples’排序,按照开销大小展开方法,最终就可以得到开销大的函数上下文, 类似:
当然,我们也可以通过上面的过滤条件选择”Modules“、”Threads“等方式来找到自己关心的瓶颈。
另外, 我们还可以在Summary界面选择‘Show Just My Code’和适当的CPU时间段来过滤。
参考:Analyzing Application Performance by Using Profiling Tools
Visual Studio 2010中的Profiler使用
标签:profiler 自我心的 debug performance
原文地址:http://blog.csdn.net/muzizongheng/article/details/44084373