http://blog.csdn.net/augusdi/article/details/12833235
CUDA从入门到精通(零):写在前面
在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这...
分类:
其他好文 时间:
2014-10-26 10:23:59
阅读次数:
357
区别一,设计初衷不同。64位操作系统的设计初衷是:满足机械设计和分析、三维动画、视频编辑和创作,以及科学计算和高性能计算应用程序等领域中需要大量内存和浮点性能的客户需求。换句简明的话说就是:它们是高科技人员使用本行业特殊软件的运行平台。而32位操作系统是为普通用户设计的。 区别二,要求配置不同。64...
分类:
其他好文 时间:
2014-10-20 13:20:22
阅读次数:
208
属性
NVIDIA GPU
Intel MIC
单核
流处理器/CUDA core
每个核运行一个线程
X86 core
每个核上最多支持4个硬件线程
主频
接近1GHz
1.0-1.1GHz
核数
数十个到数千个
57-61
并行度
...
分类:
其他好文 时间:
2014-09-29 23:09:01
阅读次数:
539
1. GPU在处理能力和存储带宽上比CPU更优势,这是由于GPU芯片更多的面积(也就是更多的晶体管)用于计算和存储,而不是控制(复杂控制单元和缓存)。
2. 指令级并行-->线程级并行-->处理器级并行-->节点级并行
3. 指令级并行办法:超标量,乱序执行,超流水,超长指令字,SIMD,分支预测。超长指令字可以减少访存。
4. 超长流水线会带来效率问题,需要更精准的预测功能和更大规模的缓存.......
分类:
其他好文 时间:
2014-09-23 21:17:47
阅读次数:
472
随着项目经验的增长笔者对分布式计算的了解是越来越深入,那么接下来笔者就和大家浅谈下分布式系统的特点吧,可以这样理解,分布式系统是将多个子任务分布在不同的物理机上并行工作。是以空间换时间并行计算来提高程序的可靠性和性能。分布式系统的高性能计算属于MIMD的范畴领域。它是按不同的业务分配不同的节点(单点...
分类:
其他好文 时间:
2014-09-15 15:54:39
阅读次数:
249
天河2号相信大家都知道啦,2013和2014TOP500中都位列榜首,是目前最快的超算,比第2名泰坦-Titan快1倍,天河2号是使用什么样的架构获得此能力的呢,下面我们来了解一下。天河二号的型号为TH-IVB-FEP,使用中央处理器及协处理器的运算架构布局:天河二号共有16,000个运算节点,..
分类:
其他好文 时间:
2014-09-12 02:32:43
阅读次数:
295
服务器定义从广义上讲,服务器是指网络中能对其它机器提供某些服务的计算机系统(如果一个PC对外提供ftp服务,也可以叫服务器)。从狭义上讲,服务器是专指某些高性能计算机,能通过网络,对外提供服务。相对于普通PC来说,稳定性、安全性、性能等方面都要求更高,因此在CPU、芯..
分类:
其他好文 时间:
2014-09-03 13:19:37
阅读次数:
188
前言 CPU 的并行编程技术,也是高性能计算中的热点,也是今后要努力学习的方向。那么它和 GPU 并行编程有何区别呢? 本文将做出详细的对比,分析各自的特点,为将来深入学习 CPU 并行编程技术打下铺垫。区别一:缓存管理方式的不同 GPU:缓存对程序员不透明,程序员可根据实际情况操纵大部分缓存...
分类:
其他好文 时间:
2014-08-11 23:56:03
阅读次数:
241
集群技术主要分为三大类:高可用性(HighAvailableCluster),例:Linux-HA负载均衡(LoadbalancingCluster),例:LVS、MOSIX高性能计算(HighPerformanceComputing),例:Beowulf我们这里使用RHEL5.2,LVS,Linux-HA,Ldirectord,构造一个高可用的负载均衡集群系统。如图:LoadBalancer是整个..
分类:
其他好文 时间:
2014-08-09 02:43:27
阅读次数:
516