码迷,mamicode.com
首页 >  
搜索关键字:gpu    ( 2258个结果
在linux和windows下anaconda+pycharm+tensorflow+cuda的配置
在Ubuntu和window下配置anaconda、pycharm、tensorflow等 ...
分类:Windows程序   时间:2020-12-17 13:02:41    阅读次数:4
检测tensorflow是否使用gpu进行计算的方式
更多python教程请到: 菜鸟教程www.piaodoo.com 人人影视www.sfkyty.com 如下所示: import tensorflow as tf sess = tf.Session(config=tf.ConfigProto(log_device_placement=True)) ...
分类:其他好文   时间:2020-12-17 12:54:30    阅读次数:3
硬件多线程
世界上最简单的处理器核心是什么样的?单核单线程! 现以GPU为例。 渲染1024个顶点,也就是1024个线程。渲染的Shader程序由两条指令组成,且都是算术逻辑指令。所有算术逻辑指令的执行都花费一个时钟周期。 FragThread threads[1024]; for (auto thread : ...
分类:编程语言   时间:2020-12-17 12:44:04    阅读次数:1
Js多线程和Event Loop
引子 几乎在每一本js相关的书籍中,都会说js是单线程的,JS是通过事件队列(Event Loop)的方式来实现异步回调的。 对很多初学JS的人来说,根本搞不清楚单线程的JS为什么拥有异步的能力,所以,我试图从进程、线程的角度来解释这个问题。 CPU 说到CPU和进程、线程,对计算机操作系统有过学习 ...
分类:编程语言   时间:2020-12-15 12:53:08    阅读次数:5
nvidia-docker(GPU)和存储驱动(storage_driver)
一、docker使用nvidia GPU 1、nvidia-docker2 安装使用NVIDIA-Docker--使用GPU的Docker容器 https://blog.csdn.net/qq_31747765/article/details/108922204 2、nvidia-container ...
分类:其他好文   时间:2020-12-10 11:23:52    阅读次数:6
CUDA 内存统一分析
CUDA 内存统一分析 关于CUDA 编程的基本知识,如何编写一个简单的程序,在内存中分配两个可供 GPU 访问的数字数组,然后将它们加在 GPU 上。 本文介绍内存统一,这使得分配和访问系统中任何处理器上运行的代码都可以使用的数据变得非常容易, CPU 或 GPU 。 图 1 .内存统一是可从系统 ...
分类:其他好文   时间:2020-12-10 11:00:49    阅读次数:4
FAISS——Milvus Community Conf 2020_澜起科技:基于异构硬件的 Milvus 及 Faiss 搜索加速
Milvus Community Conf 2020_澜起科技:基于异构硬件的 Milvus 及 Faiss 搜索加速 做芯片和数据中心的 精度下降:index 的分堆、PQ或SQ这样的量化。。 而客户的业务是以0.1%这样的精度要求去提高自己的业绩的 一旦要拷贝数据,GPU就没有优势了,FPGA ...
分类:编程语言   时间:2020-12-01 11:57:59    阅读次数:4
用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用
用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用 编写高性能的软件不是一件简单的任务。当有了可以编译和运行的代码之后,当您尝试并理解它在可用硬件上的执行情况时,将引入一个新的挑战。不同的平台,无论是cpu、gpu还是其他平台,都会有不同的硬件限制,比如可用内存带 ...
分类:其他好文   时间:2020-11-25 12:10:47    阅读次数:4
GPU, CUDA,cuDNN三者的关系总结
CPU 和 GPU GPU(图像处理器,Graphics Processing Unit)和CPU(中央处理器,Central Processing Unit)在设计上的主要差异在于GPU有更多的运算单元(如图中绿色的ALU),而Control和Cache单元不如CPU多,这是因为GPU在进行并行计 ...
分类:其他好文   时间:2020-11-20 11:37:36    阅读次数:11
Pytorch 如何高效使用GPU
Pytorch如何高效使用GPU深度学习涉及很多向量或多矩阵运算,如矩阵相乘、矩阵相加、矩阵-向量乘法等。深层模型的算法,如BP,Auto-Encoder,CNN等,都可以写成矩阵运算的形式,无须写成循环运算。然而,在单核CPU上执行时,矩阵运算会被展开成循环的形式,本质上还是串行执行。GPU(GraphicProcessUnits,图形处理器)的众核体系结构包含几千个流处理器,可将矩阵运算并行化
分类:其他好文   时间:2020-11-16 13:22:51    阅读次数:9
2258条   上一页 1 ... 3 4 5 6 7 ... 226 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!