码迷,mamicode.com
首页 > 其他好文 > 详细

GPU编程中UMA的作用及限制

时间:2017-09-27 13:14:25      阅读:197      评论:0      收藏:0      [点我收藏+]

标签:独立性   速度慢   硬件   一致性   pci   结果   作用   出错   时间   

1. UMA和hUMA

传统的UMA由于CPU和GPU各自cache的独立性,如果不能很好的处理cache同步,那么轻则访问速度变慢,重则数据出错。AMD提出的hUMA解决了这一问题,保证了cache层的数据一致性

2. UMA的限制

  • UMA不解决读回的速度慢的问题。读回渲染结果的三件事情:同步->拷贝->untile。由于PCIe是对称的,所以重点问题一般出在同步上。
  • UMA不能显著地提升性能。如前所述,在硬件支持hUMA且可以渲染untile数据的前提下才能节省拷贝的时间,即便如此,拷贝所占时间很少,所以不能显著提升性能

GPU编程中UMA的作用及限制

标签:独立性   速度慢   硬件   一致性   pci   结果   作用   出错   时间   

原文地址:http://www.cnblogs.com/derekxyw/p/7600824.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!