上記の式を計算したら、ハードウェアとソフトウェアのパフォーマンス比の初期見積もりを求めることができます。
スピードアップ = THW/TSW = Fmax * 実行時間 /Vops
並列処理を使用しない場合、初期スピードアップは 1 未満であると予測されます。
次に、パフォーマンス目標を達成するためにどれだけの並列処理が必要かを計算します。
必要な並列処理 = TGoal / THW = TGoal * Vops / (Fmax * max(VINPUT, VOUTPUT))
並列処理は、データパスの幅を広げる、複数のエンジンを使用する、複数のカーネル インスタンスを使用するなど、さまざまな方法でインプリメントできます。この後、必要性とアプリケーションの特性にあった最適な組み合わせを決める必要があります。