OCR - 3.5 简体中文

Vitis AI Library 用户指南 (UG1354)

Document ID
UG1354
Release Date
2023-06-29
Version
3.5 简体中文

该网络用于光学字符识别,包括文本检测和文本识别。该网络由 ResNet-FPN 特征提取器、检测分支和识别分支构成。此模型由 ICDAR-2017 数据集进行训练。输入为包含某些字符的图像。输出为包含所识别的字词及其位置的结构。下图显示了 OCR 的结果。

图 1. OCR 示例

下表列出了 Vitis AI Library 支持的 OCR 模型。

表 1. OCR 模型
编号 模型名称 框架
1 ocr_pt PyTorch