当前位置:首页 > 每日看点 > 正文内容

有哪些开源的ocr源码比较好?

卡卷网1年前 (2024-12-09)每日看点223

如果从开源OCR工具的精度,以及代码开源是否彻底的角度看,首屈一指是PaddleOCR。然而最近PaddleOCR很久没有对OCR系统进行更新。为此,我们开源了能够超过PaddleOCR识别系统,达到SOTA效果的OCR工具、基准和新模型(GitHub: github.com/Topdu/OpenOC)。欢迎大家使用、关注和提意见。[玫瑰][玫瑰]

通用OCR工具OpenOCR开源:

[Quick Start][Modelscope Demo][Hugging Face Demo]

特性:

1、兼具精度与效率:在OCR竞赛排行榜上精度超过PaddleOCR基线4.5%,在GPU上速度可比。

2、具有通用性:支持自然场景、文档、手写等文本识别,支持中文和英文识别。

3、支持国产框架PaddlePaddle和Pytorch训练和推理。


场景文本识别(STR)模型的统一训练和评估基准开源:

特性:

1、统一模型训练的数据集(基于大规模真实数据集Union14M)和关键超参数(训练轮数、数据增强、输入尺寸),以及统一评估策略。保证了结果的公平对比。

2、支持24种STR方法训练和推理。在保证关键超参数一致的情况下,我们对每一种方法进行学习率、优化器、正则项的多次调整训练后,得到最优结果。多种方法精度均超过了其原始超参数训练结果的5-10%,并会持续增加新的STR方法。


全新的SOTA场景文本识别模型SVTRv2开源:

特性:

1、面向任意形状文本识别和语言建模的单视觉CTC模型。

2、在多种复杂场景(弯曲、旋转、艺术字、遮挡、长文本、中文)上,精度超过了当前主流Attention-based Encoder-Decoder方法。

3、具有CTC快速推理的优势。


以上内容的⚡QuickStart、Demo、模型、大规模真实数据集、训练评估脚本已开源在GitHub: https://github.com/Topdu/OpenOCR。

有哪些开源的ocr源码比较好?  第1张


有哪些开源的ocr源码比较好?  第2张


有哪些开源的ocr源码比较好?  第3张


有哪些开源的ocr源码比较好?  第4张


有哪些开源的ocr源码比较好?  第5张


有哪些开源的ocr源码比较好?  第6张

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2024/12/3623.html

分享给朋友:

相关文章

五个私藏宝贝网站!上班族摸鱼必备,打造快乐小天地

五个私藏宝贝网站!上班族摸鱼必备,打造快乐小天地

有朋友提到,虽然一整天都在“摸鱼”,但却感觉身心俱疲,甚至比一直忙碌工作还要累。其实这背后是有科学依据的。当人专注于工作时,会进入一种“心流”状态,这种状态让人感到兴奋、满足且充实。相反,如果在工作时分心“摸鱼”,会导致注意力分散,增加认知...

支付宝碰一碰市场如何?

支付宝碰一碰市场如何?

今年,支付宝又整了新的大活,即无须扫码即能完成支付操作的“支付宝碰一碰”正式登场。下面就来给大家分析分析,这是个什么情况,为什么都在说能赚钱。支付宝碰一下怎么赚钱的?都有谁能赚到这份钱?1.支付宝碰一下原理支付宝碰一下的本质依旧是“条码支付...

网页上的视频怎么下载呀?

网页上的视频怎么下载呀?

1、贝贝BiliBili - B站视频下载https://xbeibeix.com/api/bilibili/贝贝BiliBili 是个免费、免登录的bilibili视频下载工具,没有任何套路。把视频链接粘贴进去 → 输入验证码 → 解析视...

MacOS真的比Windows流畅吗?

我现在公司配的机器,配置是绝对的大古董了惠普z230sff薄塔cpu只是个4770,没错不是4790k,4770全核睿频只有3.8g显卡更是古董,k600,已经结束驱动更新支持了,显存仅1g,跑分跑不过13代uhd核显内存是加到16g得,但...

怎样使自己处于高能量状态?

1、不要习惯性的回顾过去那些让你尴尬和犯了错误的事情,不要嫌弃自己蠢。学会原谅自己,当你不断回忆那些错误和囧事的时候,告诉自己:自己确实做错了,下次不要再犯即可,不需一遍遍的回忆。这件事情已经发生,不要再一遍遍的折磨自己,不断回忆一点好处没...

为什么现在 AI 已经没啥热度了?

从改名叫大模型那一刻,懂行的就已经放弃了,剩下资本和无知网友还有点后劲所谓大模型,本质就是一个更大、更快数据库的传声筒。更大更快本身确实很厉害,但依然只是传声筒,和AI根本不沾边数据库之外仍然一无所知,甚至数据库之内的输出逻辑还要依赖大量人...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。