有时候,主机应用所需的计算密集型任务可以跨同一内核的多个硬件实例或者跨计算单元来处理数据,以在 FPGA 上实现数据并行化。如果单个内核已编译为多个 CU,那么在单一无序命令队列中可以多次调用 clEnqueueTask
命令来支持数据并行化。每次调用 clEnqueueTask
都会调度不同 CU 中的数据工作负载,并且对其进行并行处理。
有时候,主机应用所需的计算密集型任务可以跨同一内核的多个硬件实例或者跨计算单元来处理数据,以在 FPGA 上实现数据并行化。如果单个内核已编译为多个 CU,那么在单一无序命令队列中可以多次调用 clEnqueueTask
命令来支持数据并行化。每次调用 clEnqueueTask
都会调度不同 CU 中的数据工作负载,并且对其进行并行处理。