CUDA 1 ----- Hello World From GPU

时间：2015-05-28 22:47:13 阅读：250 评论：0 收藏：0 [点我收藏+]

标签：

本篇博文仅实现hello world，先看到效果，具体细节将在后续博文解释。

准备

如果你是第一次使用CUDA，在Linux下可以使用下面的命令来检查CUDA编译器是否安装正确：

$ which nvcc

一般，该指令输出为：

/usr/local/cuda/bin/nvcc

另外，你可能还需要检查下你机器上的GPU型号，可以使用给下面的命令查询：

$ ls  -l /dev/nv*

可能的输出为：

crw-rw-rw- 1 root root 195, 0 Jul 3 13:44 /dev/nvidia0

crw-rw-rw- 1 root root 195, 1 Jul 3 13:44 /dev/nvidia1

crw-rw-rw- 1 root root 195, 255 Jul 3 13:44 /dev/nvidiactl

crw-rw---- 1 root root 10, 144 Jul 3 13:39 /dev/nvram

以上输出显示这里有两个GPU显卡安装在机器上。

写一段CUDA程序的基本过程为：

创建源文件，以”.cu”为后缀。
用nvcc编译程序。
命令行运行。

代码

首先，为了对比，先写一段简单的C程序输出hello world：

#include <stdio.h>

iint main(void){

                printf(“helllo world!\n”);

}

然后是我们所谓的kernel function（即CUDA代码）：

__global__ void helloFromGpu(void){

                printf(“hello world form GPU!\\n”);

}

限定符__global__告诉编译器这个function将由CPU调用在GPU上执行，其调用形式为：

helloFromGPU<<<1,10>>>();

一个kernel是由一组线程执行，所有线程执行相同的代码。上面一行三对尖括号中的1和10 表明了该function将有10个线程，具体含义之后博文中会详述。下面是完整代码：

#include <stdio.h>

__global__ void helloFromGPU (void)
{
    printf(“Hello World from GPU!\n”);
}

int main(void)
{
// hello from cpu
printf(“Hello World from CPU!\n”);

helloFromGPU <<<1, 10>>>();

cudaDeviceReset();

return 0;
}

这里顺便提及下，我们将CPU端称为host，GPU端称为device。

cudaDeviceReset()用来显式的摧毁清理CUDA程序占用的资源。现在用下面的命令编译：

$nvcc –arch sm_20 hello.cu –o hello

-arch sm_20是用来指定编译器使用Fermi架构产生device代码。编译成功后执行$ ./hello:

Hello World from CPU!

Hello World from GPU!

一个典型的CUDA程序结构包含五个主要步骤：

分配GPU空间。
将数据从CPU端复制到GPU端。
调用CUDA kernel来执行计算。
计算完成后将数据从GPU拷贝回CPU。
清理GPU内存空间。

CUDA 1 ----- Hello World From GPU

标签：

原文地址：http://www.cnblogs.com/1024incn/p/4537010.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行