本节侧重于演示主机程序的最优化,主机程序使用 OpenCL™ API 来调度各个计算单元的执行以及往来 FPGA 开发板的数据传输。为了对数据传输和计算调用执行最优化,您需要思考如何通过一个或多个 OpenCL 命令队列来并发执行各项任务。本节主要探讨常见的错误做法及其识别和解决方法。
本节侧重于演示主机程序的最优化,主机程序使用 OpenCL™ API 来调度各个计算单元的执行以及往来 FPGA 开发板的数据传输。为了对数据传输和计算调用执行最优化,您需要思考如何通过一个或多个 OpenCL 命令队列来并发执行各项任务。本节主要探讨常见的错误做法及其识别和解决方法。