説明
clEnqueueNDRangeKernel
を global_work_offset
を NULL またはすべて 0 に設定して使用する場合、この属性を使用すると global_work_offset
を常に 0 に指定できます。
この属性は、次のようなメモリ アクセスがある場合にメモリのパフォーマンスを向上できます。
A[get_global_id(x)] = ...;
注記: REQD_WORK_GROUP_SIZE、VEC_TYPE_HINT、および XCL_ZERO_GLOBAL_WORK_OFFSET を一緒に指定すると、パフォーマンスを最大限にできます。
構文
カーネル用に指定されたカーネル定義またはプライマリ関数の前に配置します。
__kernel __attribute__((xcl_zero_global_work_offset))
void test (__global short *input, __global short *output, __constant short *constants) { }