标签:cuda 开发 并行化 函数 应用 调用 需要 部分 传输
CUDA并行编程思维过程
1)确定应用程序中需要且可以并行化的部分
2)将并行化代码中需要用到的数据分离出来,具体方法是用API函数在并行技术设备上分配内存空间
3)用API函数将数据传输到并行计算设备上
4)在并行化部分开发一个kernel函数,该函数由其中个别线程执行
5)并行线程执行且启动kernel函数
6)最后调用API函数将数据传回主机处理器
标签:cuda 开发 并行化 函数 应用 调用 需要 部分 传输
原文地址:http://www.cnblogs.com/liang2713020/p/6696596.html