グローバル メモリにアクセスするとアプリケーションのレイテンシが大幅に増加するので、必要な転送だけを実行します。
必要な値だけを読み出して書き込み、1 回だけ実行するようにしてください。計算関数で同じ値を複数回使用する必要がある場合は、グローバル メモリから再び読み出すのではなく、値をローカルのバッファーに格納します。スループット目標を達成するためには、バッファリングおよびキャッシング構造を正しく設定することが重要となります。
グローバル メモリにアクセスするとアプリケーションのレイテンシが大幅に増加するので、必要な転送だけを実行します。
必要な値だけを読み出して書き込み、1 回だけ実行するようにしてください。計算関数で同じ値を複数回使用する必要がある場合は、グローバル メモリから再び読み出すのではなく、値をローカルのバッファーに格納します。スループット目標を達成するためには、バッファリングおよびキャッシング構造を正しく設定することが重要となります。