前言 本文将介绍 CUDA 编程的基本模式,所有 CUDA
程序都基于此模式编写,即使是调用库,库的底层也是这个模式实现的。模式描述 1. 定义需要在 device 端执行的函数。( 函数声明前加 _golbal_
关键字 ) 2. 在显存中为待运算的数据以及需要存放结果的变量开辟显存空间。(...
分类:
其他好文 时间:
2014-06-07 05:21:20
阅读次数:
269
GPU 的硬件基本概念Nvidia的版本: 实际上在 nVidia 的 GPU
里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVidia 的 GPU 里,会有非常多的 SP 可以同时做计算;而数个
SP 会在附加一些其他单元,一起组成一个 SM(Strea....
分类:
其他好文 时间:
2014-05-28 18:59:32
阅读次数:
292
前言
并行就是让计算中相同或不同阶段的各个处理同时进行。目前有很多种实现并行的手段,如多核处理器,分布式系统等。本专题的文章将主要介绍使用 GPU
实现并行的方法。参考本专题文章前请务必搭建好 CUDA 开发平台,搭建方法可以参考上一篇文章。GPU 并行的优缺点 优点: 1. 显存具有更大...
分类:
其他好文 时间:
2014-05-26 02:13:36
阅读次数:
263
转载自:http://hc.csdn.net/contents/content_details?type=1&id=3411.展开循环如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。
1 #include 2 using namesp...
分类:
其他好文 时间:
2014-05-23 23:56:27
阅读次数:
556
这几天在捣腾CUDA,用vs2012跑那个经典的julia例程的时候出了问题。问题如题。找了很多方法……最后自己误打误撞成功了。步骤就是:1)从网上下载glut的包包。里面应该会含有一个.h一个.dll和一个.lib
如果你是64位系统,把.dll放到c:/windows/sysWOW64 就是用....
分类:
其他好文 时间:
2014-05-19 09:25:17
阅读次数:
242
转自:http://blog.csdn.net/cuidiwhere/article/details/7884545
并行计算:并行计算是相对于串行计算来说的。可分为时间上的并行和空间上的并行。 时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。例如基于CUDA编程。并行计算的目的就是提供单处理器无法提供的性能(处理器能力或存储器),使用多处理器求解单个问题。...
分类:
其他好文 时间:
2014-05-18 18:29:29
阅读次数:
291
在编译CUDA程序的时候,会产生大量的警告信息的解决方法。...
分类:
其他好文 时间:
2014-05-18 14:05:38
阅读次数:
298
2014.4.25
感谢那些参加开发、发送错误报告以及通过其他方式帮助我们的所有人和公司。
源码现在已经能够从SourceForge和Github上下载了。
2.4.9版本的帮助文章也更新到现在的状态。
简单的叙述下变化:
1.新的三维可视化功能模块“viz”
2.在ocl模块上的表现更好
3.修复了安卓相机的一些问题
4.对于移动平台的CUDA支持效果有了提高
5.修复了来自社...
分类:
其他好文 时间:
2014-05-15 20:14:06
阅读次数:
253
visual profiler 调试cuda并行程序是,如果不能够通过出错的行号,定位出错行,会很麻烦。通过在编译cuda程序的时候,设置适当的编译参数,可以实现根据行号定位出错行,为调试程序提供了很大的方便。...
分类:
其他好文 时间:
2014-05-15 06:40:35
阅读次数:
295
CUDA学习,第一个kernel函数及代码讲解。本博文分为三个部分,第一部分给出一个代码示例,第二部分对代码进行讲解,第三部分根据这个例子介绍如何部署和发起一个kernel函数。...
分类:
其他好文 时间:
2014-05-14 14:10:29
阅读次数:
510