标签:
按照前面的帖子安装好之后,在几台机器上运行,运算速度简单记了一下。
1. Win7, i7-4790K, 32G (8*4)
纯CPU计算,第一遍预训练每步时间:42.x秒
2. Y480笔记本电脑,4G
GPU加速计算,第一遍预训练每步时间:90.x秒
[新显卡支持问题的解决]
之后购买了影驰GTX960 4G,运行时提示错误:
nvcc fatal : Value ‘sm_52‘ is not defined for option ‘gpu-architecture‘
网上搜索发现了答案:
http://rexdouglass.com/training-neural-networks-on-the-gpu-with-commodity-hardware-installation-and-configuration/
只要在.theanorc设置文件中加上如下内容即可:
[nvcc]
flags = -arch=sm_30
原因是CUDA6.5版本太低,显卡太新,据说换成7.0或7.5即可,我嫌麻烦,没换。
也许7.x版本的能提升速度?以后有时间再试试。
然后在两台台式机上实验:
3. Win7, i5-3450, 8G (8*1)
GPU加速计算,第一遍预训练每步时间:19.x秒
4. Win7, i7-4790K, 32G (8*4)
GPU加速计算,第一遍预训练每步时间:15.x秒
总结:
1. i7-4790K很强大
2. Y480笔记本电脑GPU很弱
3. i7台式机比i5台式机快,可能是因为内存快,同时i7的用上了双通道
CUDA6.5 + GTX960 + Winpython,运行Theano的DBN
标签:
原文地址:http://www.cnblogs.com/theagnal/p/4671955.html