OCR - 2.5 日本語

Vitis AI ライブラリ ユーザー ガイド (UG1354)

Document ID
UG1354
Release Date
2022-06-15
Version
2.5 日本語

このネットワークはテキスト検出とテキスト認識で構成され、光学文字認識 (OCR) に使用します。このネットワークは、ResNet-FPN 特徴抽出器、検出ブランチ、および認識ブランチで構成されます。このモデルは ICDAR-2017 データセットでトレーニングしています。入力は、何らかの文字を含む画像です。出力は、認識した単語とその位置を含む構造体です。次の画像は、OCR の結果を示しています。

図 1. OCR の例

次の表に、Vitis AI ライブラリでサポートされる OCR モデルを示します。

表 1. OCR モデル
番号 モデル名 フレームワーク
1 ocr_pt PyTorch