PaddleOCR

基于飞桨的 OCR 工具库
授权协议 Apache-2.0
开发语言 C/C++ Python
所属分类 神经网络/人工智能、 机器学习/深度学习
软件类型 开源软件
地区 国产
投 递 者 袁鹤轩
操作系统 跨平台
开源组织 百度
适用人群 未知
 软件概览

PaddleOCR是基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。

特性

  • 超轻量级中文OCR,总模型仅8.6M
    • 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
    • 检测模型DB(4.1M)+识别模型CRNN(4.5M)
  • 多种文本检测训练算法,EAST、DB
  • 多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE

支持的中文模型列表:

模型名称 模型简介 检测模型地址 识别模型地址
chinese_db_crnn_mobile 超轻量级中文OCR模型 inference模型 & 预训练模型 inference模型 & 预训练模型
chinese_db_crnn_server 通用中文OCR模型 inference模型 & 预训练模型 inference模型 & 预训练模型

超轻量级中文OCR在线体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr

也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。

超轻量级中文OCR以及通用中文OCR体验

上图是超轻量级中文OCR模型效果展示,更多效果图请见文末超轻量级中文OCR效果展示通用中文OCR效果展示

  • PaddleOCR简介 PaddleOCR分为文本检测、文本识别和方向分类器三部分,其中文本检测有三个模型,分别是MobileNetV3、ResNet18_vd和ResNet50,其中最常使用的是MobileNetV3模型,整体比较小,适合应用于手机端。文本识别只有一个MobileNetV3预训练模型。方向分类器使用默认的模型。 环境配置 PaddleOCR2.0的配置环境 PaddleOCR2.

 相关资料
  • class Reader(Dataset): ... class CTCLoss(paddle.nn.Layer): 来回报错: ValueError: (InvalidArgument) The type of data we are trying to retrieve (int32) does not match the type of data (int64) currently cont

  • 我试图开发一个应用程序,使用Tesseract从手机摄像头拍摄的文件中识别文本。为了更好的识别,我使用OpenCV对图像进行预处理,使用高斯模糊和阈值方法进行二值化,但结果很糟糕。 我可以使用哪些其他过滤器来使图像对Tesseract更具可读性?

  • 如何使用opencv和pytesseract从图像中提取文本? 从 PIL 导入触发器导入图像导入 np 从 matplotib 导入 pyplot 作为 plt 但这是在给错误—— Traceback(最近一次调用last):print pytesserac t . image _ to _ string(edges)File "/home/sroy 8091/中文件" open.py "的第1

  • 我正在运行的问题是从图像中提取文本,为此我使用了Tesseract V3.02。我必须从中提取文本的示例图像与仪表读数有关。有的采用实心薄片背景,有的采用LED显示屏。我已经训练的数据集为固体表的背景和结果是一些如何有效。 我现在遇到的主要问题是文本图像与LED/LCD背景,这是不被Tesseract识别,由于这一点,训练集是不生成的。 谁能指导我如何在七段显示器(LCD/LED背景)中使用Tes

  • null 有些数字比其他数字更好用--例如,'1'似乎有很多麻烦。出现在“+”或“-”后面的数字通常不显示出来,“+”通常显示为“-”。我也玩了一下阈值。 最后三个部分是因为我的视频样本,我一直在画有点歪斜。我可以尝试使用一些更好的数据,我也可以尝试在标准的“letsgoDigital”朗上制作自己的训练数据。虽然我觉得我没有以最好的方式进行图像处理,但我希望得到一些指导。 我计划使用某种程度的边

  • 本文向大家介绍基于python的ini配置文件操作工具类,包括了基于python的ini配置文件操作工具类的使用技巧和注意事项,需要的朋友参考一下 本文实例为大家分享了python的ini配置文件操作工具类的具体代码,供大家参考,具体内容如下 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持呐喊教程。