TextMountain 検出 - 3.5 日本語

Vitis AI ライブラリ ユーザー ガイド (UG1354)

Document ID
UG1354
Release Date
2023-06-29
Version
3.5 日本語

このネットワークは、多言語テキストの検出に使用します。このネットワークは、ResNet-FPN 特徴検出器と検出予測器で構成されます。このモデルは ICDAR-2017 でトレーニングしています。入力は何らかのテキストを含む画像です。出力は検出された単語とその位置を含む構造体です。次の画像は、TextMountain モデルの結果を示しています。

図 1. TextMountain 検出

表 1. TextMountain モデル
なし モデル名 フレームワーク
1 textmountain_pt PyTorch