有哪些开源的ocr源码比较好?
作者:卡卷网发布时间:2024-12-09 14:11浏览数量:125次评论数量:0次
如果从开源OCR工具的精度,以及代码开源是否彻底的角度看,首屈一指是PaddleOCR。然而最近PaddleOCR很久没有对OCR系统进行更新。为此,我们开源了能够超过PaddleOCR识别系统,达到SOTA效果的OCR工具、基准和新模型(GitHub: https://github.com/Topdu/OpenOCR)。欢迎大家使用、关注和提意见。[玫瑰][玫瑰]
通用OCR工具OpenOCR开源:
[Quick Start][Modelscope Demo][Hugging Face Demo]
特性:
1、兼具精度与效率:在OCR竞赛排行榜上精度超过PaddleOCR基线4.5%,在GPU上速度可比。
2、具有通用性:支持自然场景、文档、手写等文本识别,支持中文和英文识别。
3、支持国产框架PaddlePaddle和Pytorch训练和推理。
场景文本识别(STR)模型的统一训练和评估基准开源:
特性:
1、统一模型训练的数据集(基于大规模真实数据集Union14M)和关键超参数(训练轮数、数据增强、输入尺寸),以及统一评估策略。保证了结果的公平对比。
2、支持24种STR方法训练和推理。在保证关键超参数一致的情况下,我们对每一种方法进行学习率、优化器、正则项的多次调整训练后,得到最优结果。多种方法精度均超过了其原始超参数训练结果的5-10%,并会持续增加新的STR方法。
全新的SOTA场景文本识别模型SVTRv2开源:
特性:
1、面向任意形状文本识别和语言建模的单视觉CTC模型。
2、在多种复杂场景(弯曲、旋转、艺术字、遮挡、长文本、中文)上,精度超过了当前主流Attention-based Encoder-Decoder方法。
3、具有CTC快速推理的优势。
以上内容的⚡QuickStart、Demo、模型、大规模真实数据集、训练评估脚本已开源在GitHub: https://github.com/Topdu/OpenOCR。
免责声明:本文由卡卷网编辑并发布,但不代表本站的观点和立场,只提供分享给大家。
- 上一篇:如何评价 bangumi 这个评分网站的水平?
- 下一篇:如何评价Flutter?
相关推荐

你 发表评论:
欢迎