C++ API - 1.1 Japanese

Vitis AI ユーザー ガイド (UG1414)

Document ID
UG1414
Release Date
2020-03-23
Version
1.1 Japanese

ここでは、Vitis AI の高度な低レベル C++ プログラミング API について簡単に説明します。

名称

libn2cube.so

説明

DPU ランタイム ライブラリ

ルーチン

dpuOpen()
DPU デバイスを開いて使用法を初期化する。
dpuClose()
DPU デバイスの使用法を確定して終了する。
dpuLoadKernel()
DPU カーネルをロードして、コード/重み/バイアス セグメント用に DPU メモリ空間を割り当てる。
dpuDestroyKernel()
DPU カーネルを無効にして、関連するリソースを解放する。
dpuCreateTask()
ある DPU カーネルから 1 つの DPU タスクをインスタンシエートし、そのプライベート ワーキング メモリ バッファーを割り当て、実行コンテキストの準備をする。
dpuRunTask()
DPU タスクの実行を開始する。
dpuDestroyTask()
DPU タスクを削除し、そのワーキング メモリ バッファーを解放して、関連する実行コンテキストを無効にする。
dpuSetTaskPriority()
実行時に DPU タスクの優先度を指定した値に動的に設定する。優先度の範囲は 0 (最も高い優先度) ~ 15 (最も低い優先度)。指定しない場合、DPU タスクの優先度はデフォルトの 15 に設定される。
dpuGetTaskPriority()
DPU タスクの優先度を取得する。
dpuSetTaskAffinity()
実行時に DPU コアにおける DPU タスクのアフィニティを動的に設定する。指定しない場合、デフォルトで DPU タスクは有効なすべての DPU コアで実行可能。
dpuGetTaskAffinity()
DPU コアにおける DPU タスクのアフィニティを取得する。
dpuEnableTaskDebug()
デバッグ目的で実行中に DPU タスクのダンプ機能を有効にする。
dpuEnableTaskProfile()
実行中に DPU タスクのプロファイリング機能を有効にして、性能メトリクスを取得する。
dpuGetTaskProfile()
DPU タスクの実行時間を取得する。
dpuGetNodeProfile()
DPU ノードの実行時間を取得する。
dpuGetInputTensorCnt()
1 つの DPU タスクの入力テンソルの総数を取得する。
dpuGetInputTensor()
1 つの DPU タスクの入力テンソルの取得する。
dpuGetInputTensorAddress()
1 つの DPU タスクの入力テンソルの開始アドレスを取得する。
dpuGetInputTensorSize()
1 つの DPU タスクの入力テンソルのサイズ (バイト) を取得する。
dpuGetInputTensorScale()
1 つの DPU タスクの入力テンソルのスケール値を取得する。
dpuGetInputTensorHeight()
1 つの DPU タスクの入力テンソルの高さを取得する。
dpuGetInputTensorWidth()
1 つの DPU タスクの入力テンソルの幅を取得する。
dpuGetInputTensorChannel()
1 つの DPU タスクの入力テンソルのチャネル サイズを取得する。
dpuGetOutputTensorCnt()
1 つの DPU タスクの出力テンソルの総数を取得する。
dpuGetOutputTensor()
1 つの DPU タスクの出力テンソルを取得する。
dpuGetOutputTensorAddress()
1 つの DPU タスクの出力テンソルの開始アドレスを取得する。
dpuGetOutputTensorSize()
1 つの DPU タスクの出力テンソルのサイズ バイトを取得する。
dpuGetOutputTensorScale()
1 つの DPU タスクの出力テンソルのスケール値を取得する。
dpuGetOutputTensorHeight()
1 つの DPU タスクの出力テンソルの高さを取得する。
dpuGetOutputTensorWidth()
1 つの DPU タスクの出力テンソルの幅を取得する。
dpuGetOutputTensorChannel()
1 つの DPU タスクの出力テンソルのチャネル サイズを取得する。
dpuGetTensorSize()
1 つの DPU テンソルのサイズを取得する。
dpuGetTensorAddress()
1 つの DPU テンソルの開始アドレスを取得する。
dpuGetTensorScale()
1 つの DPU テンソルのスケール値を取得する。
dpuGetTensorHeight()
1 つの DPU テンソルの高さを取得する。
dpuGetTensorWidth()
1 つの DPU テンソルの幅を取得する。
dpuGetTensorChannel()
1 つの DPU テンソルのチャネル サイズを取得する。
dpuSetInputTensorInCHWInt8()
DPU タスクの入力テンソルを、INT8 形式で Caffe 表記順 (チャネル/高さ/幅) で保存されたデータで設定する。
dpuSetInputTensorInCHWFP32()
DPU タスクの入力テンソルを、FP32 形式で Caffe 表記順 (チャネル/高さ/幅) で保存されたデータで設定する。
dpuSetInputTensorInHWCInt8()
DPU タスクの入力テンソルを、INT8 形式で DPU 表記順 (高さ/幅/チャネル) で保存されたデータで設定する。
dpuSetInputTensorInHWCFP32()
DPU タスクの入力テンソルを、FP32 形式で DPU 表記順 (チャネル/高さ/幅) で保存されたデータで設定する。
dpuGetOutputTensorInCHWInt8()
DPU タスクの出力テンソルを取得し、INT8 形式で Caffe 表記順 (チャネル/高さ/幅) で保存する。
dpuGetOutputTensorInCHWFP32()
DPU タスクの出力テンソルを取得し、FP32 形式で Caffe 表記順 (チャネル/高さ/幅) で保存する。
dpuGetOutputTensorInHWCInt8()
DPU タスクの出力テンソルを取得し、INT8 形式で DPU 表記順 (チャネル/高さ/幅) で保存する。
dpuGetOutputTensorInHWCFP32()
DPU タスクの出力テンソルを取得し、FP32 形式で DPU 表記順 (チャネル/高さ/幅) で保存する。
dpuRunSoftmax ()
入力エレメントに対して softmax 計算を実行し、結果を出力メモリ バッファーに保存する。
dpuSetExceptionMode()
エッジ DPU のランタイム N2Cube に対して例外処理モードを設定する。
dpuGetExceptionMode()
ランタイム N2Cube の例外処理モードを取得する。
dpuGetExceptionMessage()
N2Cube API で返されるエラー コード (常に負の値) からエラー メッセージを取得する。
dpuGetInputTotalSize()
すべての境界入力テンソルを含む、DPU タスクの入力メモリ バッファーの合計サイズ (バイト) を取得する。
dpuGetOutputTotalSize()
すべての境界出力テンソルを含む DPU タスクの出力メモリ バッファーの合計サイズ (バイト) を取得する。
dpuGetBoundaryIOTensor()
指定したテンソル名から DPU タスクの境界入力または出力テンソルを取得する。モデルがコンパイルされた後に VAI_C コンパイラによってテンソル名が一覧表示される。
dpuBindInputTensorBaseAddress()
入力メモリ バッファーの指定されたベース物理アドレスと仮想アドレスを DPU タスクに結び付ける。スプリット IO モードで VAI_C によってコンパイルされた DPU カーネルに対してのみ使用可能。スプリット IO モードで VAI_C によってコンパイルされた DPU カーネルに対してのみ使用可能。
dpuBindOutputTensorBaseAddress()
出力メモリ バッファーの指定されたベース物理アドレスと仮想アドレスを DPU タスクに結び付ける。スプリット IO モードで VAI_C によってコンパイルされた DPU カーネルに対してのみ使用できる。

インクルード ファイル

n2cube.h