姿勢検出ライブラリは、人物の姿勢を検出するために使用されます。このライブラリには、人物の 14 の特徴点を識別できるニューラル ネットワークが含まれています。通常、Vitis AI Model Zoo に含まれる SSD や RefineDet などの歩行者検出ニューラル ネットワークで検出された領域をクロップしたものを入力します。出力は、各ポイントの座標を含む構造体となります。次の画像は、姿勢検出の結果を示しています。
図 1. 姿勢検出の例
次の表に、Vitis AI ライブラリでサポートされる姿勢検出モデルを示します。
番号 | モデル名 | フレームワーク |
---|---|---|
1 | sp_net | Caffe |
注記: 入力画像が定まっておらず、ユーザーが人物の座標を把握していない場合は、カスケード型人物検出を実行します (姿勢検出パイプラインが必要です)。test_jpeg_posedetect_with_ssd.cpp ファイルを参照してください。test_jpeg_posedetect_ssd の入力画像には、人物が含まれていても、含まれていなくてもかまいません。画像に人物が含まれる場合、まずこのカスケード型パイプラインで SSD によって人物が検出され、次に、その人物の姿勢が posedetect の入力として渡されます。検出ネットワークが画像内で人物を特定しない場合、posedetect は実行されません。test_jpeg_posedetect では posedetect のみが実行されるため、1 人以上の人物が入力画像に含まれている必要があります。人物が含まれない画像を test_jpeg_posedetect の入力に使用すると、エラーが返されます。test_jpeg_posedetect.cpp ファイルを参照してください。