cuda自己常犯的傻逼错误

时间：2015-05-12 08:02:58 阅读：110 评论：0 收藏：0 [点我收藏+]

标签：

１．使用shared memory时如果申明

__shared__ myshared;

在使用ｋｅｒｎｅｌ函数时不需要指明ｓｈａｒｅｄ的大小

如果使用

ｅｘｔｅｒｎ　＿＿ｓｈａｒｅｄ＿＿　ｍｙｓｈａｒｅｄ；

需要再使用ｋｅｒｎｅｌ时再＜＜＜＞＞＞中指明所使用的ｓｈａｒｅｄｍｅｍｏｒｙ的大小．

２．没有为申明的ｄｅｖｉｃｅ变量申请空间

再运行ｃｕｄａ代码的时候，如果没有使用检错函数，对于没有为在ＧＰＵ中使用的内存使用

ｃｕｄａｍａｌｌｏｃ分配存储空间的时候，代码可以编译通过，并且可以运行，成功，但实际上并没有

发起ｋｅｒｎｅｌ函数，最后导致的结果就是我们看到结果时错误的，但是却不知道错误再哪里

所以发现没有得到ｋｅｒｎｅｌ运行后期望的输出时首先检错ｄｅｖｉｃｅ＇上的内醋是否分配了

或者输出的结果

３．

__syncthreads(); }
if (tid < 32) {
if (blockSize >= 64) sdata[tid] += sdata[tid + 32];//for every time a warp to execute one instruction
__syncthreads();
if (blockSize >= 32) sdata[tid] += sdata[tid + 16];
__syncthreads();
if (blockSize >= 16) sdata[tid] += sdata[tid + 8];
__syncthreads();
if (blockSize >= 8) sdata[tid] += sdata[tid + 4];
__syncthreads();
if (blockSize >= 4) sdata[tid] += sdata[tid + 2];
__syncthreads();
if (blockSize >= 2) sdata[tid] += sdata[tid + 1];
__syncthreads();
}
if (tid == 0) c[blockIdx.x] = sdata[0];

在进行ｒｅｄｕｃｔｉｏｎ的时候我们将循环展开，消除线程对齐带来的麻烦．

cuda自己常犯的傻逼错误

标签：

原文地址：http://www.cnblogs.com/Erdos001/p/4496245.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行