码迷,mamicode.com
首页 > 其他好文 > 详细

CUDA 计时

时间:2014-08-24 11:33:52      阅读:299      评论:0      收藏:0      [点我收藏+]

标签:des   blog   ar   art   div   代码   log   amp   on   

CUDA Runtime API提供了用于计时的接口,可以用如下代码对在GPU上运行的CUDA程序进行计时,计时结果以毫秒为单位:

cudaEvent_t start, stop;  
cudaEventCreate(&start);      
cudaEventCreate(&stop);    
cudaEventRecord(start, 0);  
  
//需要计时的在GPU上运行的程序  

cudaEventRecord(stop, 0);   
cudaEventSynchronize(stop);  
float elapsedTime;  
cudaEventElapsedTime(&elapsedTime, start, stop);  
cudaEventDestroy(start);  
cudaEventDestroy(stop);  
printf("Kernel time: %.3f ms\n", elapsedTime);  

需要注意的是函数cudaEventSynchronize() 不可或缺,因为CUDA的kernel函数是以异步方式执行的,调用后立刻返回,这会导致计时不准确。

cudaEventSynchronize(stop)会使得直到GPU执行完cudaEventRecord(stop, 0)之前的所有语句时,事件stop才会被记录下来,即起到同步的作用。

CUDA 计时

标签:des   blog   ar   art   div   代码   log   amp   on   

原文地址:http://www.cnblogs.com/superlc320/p/3932609.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!