欢迎参与评论,每一条合规评论都是对我们的褒奖。
请 登录 或 快速注册 后发表评论
◆ 更高效的图形与计算架构:异步派遣
![]() |
Cayman同时加强了GPU通用计算能力,主要是采用了异步派遣机制,具备同时执行多个Kernel内核的能力,这些Kernel内核都有自己的命令队列和受保护的虚拟地址。另外还采用了双DMA(Direct Memory Access)引擎,可以实现更快的系统内存读写。
其它改进还包括:
· 实现Shader合并读操作
· 实现直接从LDS(Local Data Share)拾取数据
· 改进流控制
· 更快的双精度操作,Cayman的双精度操作性能是单精度操作性能的1/4,而Cypress的双精度性能是单精度的1/5,这主要是因为VLIW结构变化引起的。
![]() |