由于访问全局存储器可能会给应用程序增加大量时延,因此请仅执行必要的传输。
准则是仅读写必要的值,并且仅执行一次读写。如果计算函数必须多次使用相同的值,那么请在本地缓冲该值,而不是重复从全局存储器读取该值。完成适当的缓冲和缓存结构编码可能是实现吞吐量目标的关键。
由于访问全局存储器可能会给应用程序增加大量时延,因此请仅执行必要的传输。
准则是仅读写必要的值,并且仅执行一次读写。如果计算函数必须多次使用相同的值,那么请在本地缓冲该值,而不是重复从全局存储器读取该值。完成适当的缓冲和缓存结构编码可能是实现吞吐量目标的关键。