首页 > 其他好文 > 详细

GPU与MIC对比

时间：2014-09-29 23:09:01 阅读：539 评论：0 收藏：0 [点我收藏+]

标签：cuda gpu mic intel xeon phi mic高性能计算编程指南

属性	NVIDIA GPU	Intel MIC
单核	流处理器/CUDA core 每个核运行一个线程	X86 core 每个核上最多支持4个硬件线程
主频	接近1GHz	1.0-1.1GHz
核数	数十个到数千个	57-61
并行度	Grid、block、thread多级并行细粒度并行(线程数>>核数) 线程之间开销为0	线程+向量化线程数<=(核数-1)*4 向量化宽度512bit（单精度：16，双精度：8）
内存大小（GB）	最大12GB	6/8/16GB
内存带宽	288 GB/s	240-352GB/s
数据访问要求	Warp内的线程访问的数据连续最佳	线程内访问的数据连续；如果向量化的话，向量化的数据访问连续最佳
峰值性能	单精度：最大4.29TFlops 双精度：最大1.43TFlops 计算方法：指令吞吐率运算单元数量频率	单精度：2.0-2.2 TFlops 双精度：1.0-1.1 TFlops Sample DP calculation: 16 DP FLOPs/clock/core * 61 cores * 1.1GHz = 1073.6 GFLOP/s
编程语言	CUDA、OpenCL、OpenACC	OpenMP、OpenCL、Cilk、OpenACC
编程模式	Offload	Offload、Native、Symmetric
功耗	235W	225-300W
PCI-E带宽	支持2.0（双向各8GB/s）支持3.0（双向各16GB/s）	支持2.0（双向各8GB/s）目前不支持3.0
运行平台	PC、服务器、工作站个人可以在PC上配置一块GeForce卡运行CUDA，成本低、性能高	服务器比较专业，成本较高，个人很少配置
产品	GeForce：几百到几千元，用在PC上（当前主流GTX710-780） Tesla：1W-3W元，用在服务器上（当前主流K20，K40） Quadro：数千元，用在工作站上（当前主流Quadro K4100M、Quadro K3100M、Quadro K2100M、Quadro K610M）	KNC：1W-2W元左右当前主流7110P、5110P、3110P
支持的操作系统	Windows：XP、win7、win8 Linux X86：Fedora、OpenSUSE、RHEL/CentOS、SLES、SteamOS、Ubuntu等 Linux ARM：Ubuntu Mac OSX	Windows：Windows 8 Server, Win 7, Win 8 Linux：RedHat6.0及以上，SuSE SLES11及以上
卡上自带OS	无	自带uOS，有独立IP

GPU与MIC对比

标签：cuda gpu mic intel xeon phi mic高性能计算编程指南

原文地址：http://blog.csdn.net/zhang0311/article/details/39675499

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！