当前位置：首页 > 每日看点

有哪些开源的ocr源码比较好？

卡卷网2年前 (2024-12-09)每日看点300

如果从开源OCR工具的精度，以及代码开源是否彻底的角度看，首屈一指是PaddleOCR。然而最近PaddleOCR很久没有对OCR系统进行更新。为此，我们开源了能够超过PaddleOCR识别系统，达到SOTA效果的OCR工具、基准和新模型（GitHub: https://github.com/Topdu/OpenOCR）。欢迎大家使用、关注和提意见。[玫瑰][玫瑰]

通用OCR工具OpenOCR开源：

[Quick Start][Modelscope Demo][Hugging Face Demo]

特性：

1、兼具精度与效率：在OCR竞赛排行榜上精度超过PaddleOCR基线4.5%，在GPU上速度可比。

2、具有通用性：支持自然场景、文档、手写等文本识别，支持中文和英文识别。

3、支持国产框架PaddlePaddle和Pytorch训练和推理。

场景文本识别（STR）模型的统一训练和评估基准开源：

特性：

1、统一模型训练的数据集（基于大规模真实数据集Union14M）和关键超参数（训练轮数、数据增强、输入尺寸），以及统一评估策略。保证了结果的公平对比。

2、支持24种STR方法训练和推理。在保证关键超参数一致的情况下，我们对每一种方法进行学习率、优化器、正则项的多次调整训练后，得到最优结果。多种方法精度均超过了其原始超参数训练结果的5-10%，并会持续增加新的STR方法。

全新的SOTA场景文本识别模型SVTRv2开源：

特性：