本文主要针对与我一样的小白想使用CUDA加速方法,而经过Visual Studio编译器对cuda代码反复试验与调整得到以下成果。 目前本文主要使用一维数组对CUDA的grid与block的组合尝试,已实现CUDA一维数组的计算,将其记录如下。 而我也将会在下篇继续使用多维数组使用CUDA计算。 本 ...
分类:
编程语言 时间:
2021-07-05 19:02:58
阅读次数:
0
打开nvvp并新建session时弹窗报错 解决方法: 添加环境变量Path: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\extras\CUPTI\lib64 完成后,重启nvvp即可 ...
分类:
其他好文 时间:
2021-07-02 16:14:21
阅读次数:
0
背景 背景: 由于工作需要, 需要在现有opencv 3.3.1版本上安装opencv2.4.11版本, 安装目录为/usr/local/opencv-2.4/下, 根据多版本安装教程, 出现了opencv与cuda的安装冲突. 编译出错如下: CMake Error: The following ...
分类:
其他好文 时间:
2021-06-28 18:51:29
阅读次数:
0
一.安装cuda11.0 cuda下载 此处的cuda下载请根据自己的系统信息下载,否则使用会有问题。 安装说明 : wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda_11.0.3 ...
分类:
系统相关 时间:
2021-06-24 18:33:54
阅读次数:
0
简介 先安装nvidia驱动,然后安装cuda 查看显卡型号 lspci | grep -i nvidia 查看NVIDIA驱动版本 sudo dpkg --list | grep nvidia-* N卡驱动安装 有以下三种nvidia驱动安装方式. 集成驱动管理和安装 sudo add-apt-r ...
分类:
其他好文 时间:
2021-06-24 17:41:15
阅读次数:
0
删除、卸载 sudo rm /etc/apt/sources.list.d/cuda* sudo apt-get --purge remove "*cublas*" "cuda*" "nsight*" sudo apt-get --purge remove "*nvidia*" sudo apt-g ...
分类:
其他好文 时间:
2021-06-16 17:58:13
阅读次数:
0
矩阵乘法是最常见的操作,现代神经网络的基础便是矩阵乘法。 一个N*M的矩阵,乘以一个M*P的矩阵,得到N*P的矩阵,矩阵乘法即为将每一行与被乘矩阵对应列进行乘加,最后将所有结果进行汇总。 CPU版本 根据以上矩阵乘法的描述,便可以很快地实现矩阵乘法,三层循环,最内层循环做向量的乘加,最外的两层则做输 ...
分类:
其他好文 时间:
2021-06-13 10:13:25
阅读次数:
0
模型部署 安装 保证CUDA和pytorch安装好的基础上,将YOLOv5的源码拷到本地。 $ git clone https://github.com/ultralytics/yolov5.git 在Anaconda的shell里面,安装官方给好的配置文件requirements.txt。 $ p ...
分类:
其他好文 时间:
2021-06-02 18:58:40
阅读次数:
0
卸载cudnn sudo rm -rf /usr/local/cuda/include/cudnn.h sudo rm -rf /usr/local/cuda/lib64/libcudnn* 卸载cuda 第一步 sudo /usr/local/cuda-10.1/bin/cuda-uninstal ...
分类:
系统相关 时间:
2021-06-02 13:55:10
阅读次数:
0
Tensor基本理论 深度学习框架使用Tensor来表示数据,在神经网络中传递的数据均为Tensor。 Tensor可以将其理解为多维数组,其可以具有任意多的维度,不同Tensor可以有不同的数据类型 (dtype) 和形状 (shape)。 同一Tensor的中所有元素的dtype均相同。如果对 ...
分类:
其他好文 时间:
2021-05-24 02:42:46
阅读次数:
0