Ubuntu14.10+cuda7.0+caffe配置
一:linux安装
Linux安装不说了,我这里安装的是ubuntu14.10
二:nVidia驱动和CUDA Toolkit的安装和调试(*.run方法)
1: Verify You Have a CUDA-Capable GPU
执行下面的操作,然后验证硬件支持GPU CUDA,只要型号存在于https://develop...
分类:
系统相关 时间:
2015-07-03 15:47:22
阅读次数:
413
鉴于自己的毕设需要使用GPU CUDA这项技术,想找一本入门的教材,选择了Jason Sanders等所著的书《CUDA By Example an Introduction to General Purpose GPU Programming》。这本书作为入门教材,写的很不错。自己觉得从理解与记忆...
分类:
其他好文 时间:
2015-06-11 22:32:25
阅读次数:
186
cuda install at centos 全过程。2015年5月15日,亲测通过。yum 安装,包括所有依赖。...
分类:
其他好文 时间:
2015-05-15 06:44:36
阅读次数:
188
世界上某些最快的计算机是集群组成的。集群是有多个计算机通过高速网络连接起来的一个计算系统。集群计算机比单台计算机可以达到更高的可用性,可靠性和伸缩性。随着对基于GPU的高性能计算采用越来越广,英伟达GPU逐渐成为世界上最厉害的超级计算集群的一部分。世界前500的超级计算机中,包括差不多50个采用了英伟达的的GPU,并且目前世界上最快的计算机泰坦,使用了大约18000个英伟达开普勒GPU。在这个帖子中...
分类:
其他好文 时间:
2015-03-03 00:00:49
阅读次数:
645
卷积操作的GPU粗粒度并行实现及测试
一、 算法基本思想:
1、 GPU中的一个线程产生一个卷积结果,有多少个结果就使用多少个Block;
2、 矩阵和卷积核存放在共享内存中,卷积结果存放在全局内存中;
3、 支持10000以内任意维度的二维矩阵,卷积核最大支持16x16。
4、 支持任意多幅图像的批处理。...
分类:
其他好文 时间:
2015-03-02 11:11:59
阅读次数:
235
本文主要介绍如何使用CUDA并行计算框架编程实现机器学习中的Kmeans算法,Kmeans算法的详细介绍在这里,本文重点在并行实现的过程。...
分类:
编程语言 时间:
2015-02-01 21:54:01
阅读次数:
219
现在需要求得一个数组的所有元素之和,之前感觉似乎不太可能,因为每个线程只处理一个元素,无法将所有元素联系起来,但是最近学习了一段代码可以实现,同时也对shared memory有了进一步的理解。...
分类:
编程语言 时间:
2015-01-22 23:23:26
阅读次数:
336
本文从软硬件层面讲一下CUDA的结构,应用,逻辑和接口。分为以下章节:
(一)、GPU与CPU
(二)、CUDA硬件层面
(三)、CUDA安装
(四)、CUDA 结构与接口
4.1 Kernels
4.2 Thread,Block, Grid
4.3 Memory
4.4 Execution
(五)、码HelloWorld——数组求和...
分类:
其他好文 时间:
2015-01-09 10:50:23
阅读次数:
155
首先,正确安装OpenCV,并且通过测试。我理解GPU的环境配置由3个主要步骤构成。1. 生成关联文件,即makefile或工程文件2. 编译生成与使用硬件相关的库文件,包括动态、静态库文件。3. 将生成的库文件加入到程序中,加入过程类似于OpenCV库的添加过程。详细操作参见:http://wen...
分类:
其他好文 时间:
2014-08-20 12:11:32
阅读次数:
189