当前位置：首页 > 软件库 > 神经网络/人工智能 > 机器学习/深度学习 >

PaddleOCR

基于飞桨的 OCR 工具库

授权协议 Apache-2.0

开发语言 C/C++ Python

所属分类神经网络/人工智能、机器学习/深度学习

软件类型开源软件

地区国产

投递者袁鹤轩

操作系统跨平台

开源组织百度

适用人群未知

软件官网

软件文档

官方下载

软件概览

PaddleOCR是基于飞桨的OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

特性

超轻量级中文OCR，总模型仅8.6M
- 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
- 检测模型DB（4.1M）+识别模型CRNN（4.5M）
多种文本检测训练算法，EAST、DB
多种文本识别训练算法，Rosetta、CRNN、STAR-Net、RARE

支持的中文模型列表:

模型名称	模型简介	检测模型地址	识别模型地址
chinese_db_crnn_mobile	超轻量级中文OCR模型	inference模型 & 预训练模型	inference模型 & 预训练模型
chinese_db_crnn_server	通用中文OCR模型	inference模型 & 预训练模型	inference模型 & 预训练模型

超轻量级中文OCR在线体验地址：https://www.paddlepaddle.org.cn/hub/scene/ocr

也可以按如下教程快速体验超轻量级中文OCR和通用中文OCR模型。

超轻量级中文OCR以及通用中文OCR体验

上图是超轻量级中文OCR模型效果展示，更多效果图请见文末超轻量级中文OCR效果展示和通用中文OCR效果展示。

使用案例

PaddleOCR使用详解

PaddleOCR简介 PaddleOCR分为文本检测、文本识别和方向分类器三部分，其中文本检测有三个模型，分别是MobileNetV3、ResNet18_vd和ResNet50，其中最常使用的是MobileNetV3模型，整体比较小，适合应用于手机端。文本识别只有一个MobileNetV3预训练模型。方向分类器使用默认的模型。环境配置 PaddleOCR2.0的配置环境 PaddleOCR2.

相关资料

python - 飞桨参数类型报错？

class Reader(Dataset): ... class CTCLoss(paddle.nn.Layer): 来回报错： ValueError: (InvalidArgument) The type of data we are trying to retrieve (int32) does not match the type of data (int64) currently cont
基于OpenCV的Tesseract OCR图像预处理

我试图开发一个应用程序，使用Tesseract从手机摄像头拍摄的文件中识别文本。为了更好的识别，我使用OpenCV对图像进行预处理，使用高斯模糊和阈值方法进行二值化，但结果很糟糕。我可以使用哪些其他过滤器来使图像对Tesseract更具可读性？
用于OCR的OpenCv pytesseract

如何使用opencv和pytesseract从图像中提取文本？从 PIL 导入触发器导入图像导入 np 从 matplotib 导入 pyplot 作为 plt 但这是在给错误—— Traceback(最近一次调用last):print pytesserac t . image _ to _ string(edges)File "/home/sroy 8091/中文件" open.py "的第1
基于Tesseract OCR的七段显示文本检测

我正在运行的问题是从图像中提取文本，为此我使用了Tesseract V3.02。我必须从中提取文本的示例图像与仪表读数有关。有的采用实心薄片背景，有的采用LED显示屏。我已经训练的数据集为固体表的背景和结果是一些如何有效。我现在遇到的主要问题是文本图像与LED/LCD背景，这是不被Tesseract识别，由于这一点，训练集是不生成的。谁能指导我如何在七段显示器（LCD/LED背景）中使用Tes
基于OpenCV的Tesseract OCR七段图像预处理

null 有些数字比其他数字更好用--例如，'1'似乎有很多麻烦。出现在“+”或“-”后面的数字通常不显示出来，“+”通常显示为“-”。我也玩了一下阈值。最后三个部分是因为我的视频样本，我一直在画有点歪斜。我可以尝试使用一些更好的数据，我也可以尝试在标准的“letsgoDigital”朗上制作自己的训练数据。虽然我觉得我没有以最好的方式进行图像处理，但我希望得到一些指导。我计划使用某种程度的边
基于python的ini配置文件操作工具类

本文向大家介绍基于python的ini配置文件操作工具类，包括了基于python的ini配置文件操作工具类的使用技巧和注意事项，需要的朋友参考一下本文实例为大家分享了python的ini配置文件操作工具类的具体代码，供大家参考，具体内容如下以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持呐喊教程。

PaddleOCR

特性

支持的中文模型列表:

超轻量级中文OCR以及通用中文OCR体验

同类工具

相关阅读

相关文章

相关问答

相关文档