ストリームオブブロックの記述形式

ストリームオブブロックの記述形式 - 2023.2 日本語

Vitis 高位合成ユーザーガイド (UG1399)

Document ID

UG1399

Release Date

2023-12-18

Version

2023.2 日本語

一方、ストリームオブブロックの場合、プロデューサーとコンシューマー間の通信は配列のようなオブジェクトのストリームとして記述され、PIPO を介した配列転送よりも利点があります。

コードでストリームオブブロックを使用するには、次のインクルードファイルが必要です。

#include "hls_streamofblocks.h"

ストリームオブブロックオブジェクトのテンプレートは、hls::stream_of_blocks<block_type, depth> v です。

説明:

<block_type> は、ストリームオブブロックによって保持される配列または多次元配列のデータ型を指定します
<depth> は、hls::stream または PIPO と同様に深さ制御するオプションの引数で、指定した時間でプロデューサーが取得したブロックとコンシューマーが取得したブロックを含むブロックの合計数を指定します。デフォルト値は 2 です。
v は、ストリームオブブロックの変数名を指定します。

ストリームオブブロックのブロックにアクセスするには、次の手順を実行します。

ストリームに最初にアクセスするプロデューサーまたはコンシューマープロセスは、hls::write_lock または hls::read_lock オブジェクトを使用して、ストリームへのアクセス権を取得する必要があります。
プロデューサーがロックを取得したら、取得したブロックの書き込み (読み出し) を開始できます。ブロックが完全に初期化されたら、write_lock オブジェクトが有効範囲外になったときに、プロデューサーにより解放できます。

注記: 新しく取得されたバッファーには初期化されていないデータが含まれていると想定されるため、既に書き込まれた場所からの読み出すだけであれば、write_lock を使用したプロデューサープロセスがブロックを読み出すこともできます。ブロックの書き込みと読み出しの機能は、プロデューサープロセスに固有であり、コンシューマーではサポートされません。
次に、ブロックが FIFO 形式でブロックオブストリームのキューに入れられ、コンシューマーが read_lock オブジェクトを取得すると、このブロックをコンシューマープロセスにより読み出すことができます。

前の例で示されている hls::stream_of_blocks と PIPO メカニズムの主な違いは、ブロックがプロデューサープロセスの戻り値が出力される際だけでなく、write_lock が範囲外になるとすぐにコンシューマーに提供できるようになる点です。このため、元の例 (データフローループなし) を管理するために必要なストレージのサイズは、PIPO のみの場合よりもストリームオブブロックの方がかなり小さくなります。この例の場合、2xMxN ではなく、2N になります。

次は、前の例を hls::stream_of_blocks を使用するように書き直したものになります。プロデューサーは、b という hls::write_lock オブジェクトを作成し、それを s という名前のストリームオブブロックオブジェクトへの参照に渡して、ブロックを取得します。write_lock オブジェクトは、オーバーロードされた配列アクセス演算子を提供するので、次の例に示すように、基盤となるストレージにランダムな順序で配列としてアクセスできるようになります。

ロックの取得は write_lock/read_lock オブジェクトを構築することによって実行され、そのオブジェクトが範囲外になったときにそのオブジェクトが破棄されると、自動的に解放されます。このアプローチでは、よくある RAII (Resource Acquisition Is Initialization) 形式のロックおよびアンロックを使用します。

#include "hls_streamofblocks.h"
typedef int buf[N];
void producer (hls::stream_of_blocks<buf> &s, ...) {
  for (int i = 0; i < M; i++) {
    // Allocation of hls::write_lock acquires the block for the producer
    hls::write_lock<buf> b(s);
    for (int j = 0; j < N; j++)
      b[f(j)] = ...;
    // Deallocation of hls::write_lock releases the block for the consumer
  }
}
  
void consumer(hls::stream_of_blocks<buf> &s, ...) {
  for (int i = 0; i < M; i++) {
    // Allocation of hls::read_lock acquires the block for the consumer
    hls::read_lock<buf> b(s);
    for (int j = 0; j < N; j++)
       ... = b[g(j)] ...;
    // Deallocation of hls::write_lock releases the block to be reused by the producer
  }
}
  
void top(...) {
#pragma HLS dataflow
  hls::stream_of_blocks<buf> s;
  
  producer(b, ...);
  consumer(b, ...);
}

このアプローチの主な特長は、次のとおりです。

上記のプロデューサーの外部ループのパフォーマンスは、全体の開始間隔 (II) = 1 を達成できるはずです。
ロックされたブロックは、解放されるまで、プロデューサーまたコンシューマープロセスに対してプライベートであるかのように使用できます。
プロデューサーの配列オブジェクトの初期状態は未定義ですが、コンシューマー用にプロデューサーによって書き込まれた値が含まれます。
ストリームオブブロックの主な利点は、コンシューマーとプロデューサーの複数の反復をオーバーラップして実行し、スループットを向上させるところです。