当前位置：首页 > 软件库 > 程序开发 > OCR开发包 >

Pyocr

Python 的 OCR 库

授权协议 GPLv3

开发语言 Python

所属分类程序开发、 OCR开发包

软件类型开源软件

地区不详

投递者谢同化

操作系统跨平台

开源组织无

适用人群未知

软件官网

官方下载

软件概览

Pyocr 是 OCR 引擎的简单 Python 封装，支持 Tesseract 和 Cuneiform 等。支持 Python 2.7 和 3.x，要求 Pillow。

示例代码：

import Image
import sys
from pyocr import pyocr

tools = pyocr.get_available_tools()[:]
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
print("Using '%s'" % (tools[0].get_name()))
tools[0].image_to_string(Image.open('test.png'), lang='fra',
                         builder=TextBuilder())

使用案例

pyocr(tools=Tesseract)

最近在搞网银的账单爬取，由于安全性比较高，多采用安全控件和数字键盘的形式，很是头疼，不过耐心抓包分析还是有结果的。言归正传，这里用到pyocr用于图片识别，主要是为了截取数字键盘的背景图片，需要先对图片进行切割，然后再像素放大，最后用pyocr进行识别，这样的效果会好很多。（讲道理，正常应该将图片转换矩阵，二值化，只是我没花心思弄这个，找个好用的轮子挺好的）先安装Tesseract（官方说支持l
pyocr报错convert-im6.q16: not authorized

按照下面的操作进行Python的OCR文字识别（识别PDF文字） https://pythontips.com/2016/02/25/ocr-on-pdf-files-using-python/ http://blog.topspeedsnail.com/archives/3571 运行出现错误 wand.exceptions.PolicyError: not authorized `/tmp/x
pyocr tesseract 系统找不到指定的文件问题解决办法

FileNotFoundError: [WinError 2] 系统找不到指定的文件。废话不多说，上代码 from PIL import Image from pyocr import tesseract tesseract.TESSERACT_CMD = r'C:\Program Files\Tesseract-OCR\tesseract.exe' print(tesseract.image
Pyocr 0.2 发布，Python 的 OCR 库 - 开源中国社区

Pyocr 0.2 发布，Python 的 OCR 库 - 开源中国社区 Pyocr 0.2 发布，Python 的 OCR 库
PyOCR get_availables_tools（）返回空列表/可以从命令lin访问tesseract

我正试图在运行Windows 7的计算机上安装PyOCR。我已经安装了适用于Windows的Tesseract OCR 3.05，并将包含Tesseract的目录(C:\Program Files(x86)\Tesseract OCR)添加到PATH用户变量PATH系统变量中，并使用Tesseract目录创建了新的系统变量TESSDATA_前缀。在我能够从命令行直接使用Tesseract来处理图

相关资料

OCR

1.接口描述该 API 用于识别静态身份证图像上的,文字信息。算法主要针对第二代居民身份证，其他类型身份证检测结果准确率较低，仅供参考。图片要求格式为 JPG（JPEG），BMP，PNG，GIF，TIFF 宽和高大于 8px，小于等于4000px 小于等于 5 MB 支持自动识别人脸方向上传的图片中包含有 exif 方向信息，先按此信息旋转、翻转后再做识别人脸方向并调整，并在返回结果中给
/ocr/parse_bankcard_ocr_result

1.接口描述对APP端银行卡的OCR扫描结果进行解析，并返回解析结果，本接口需要配合APP端SDK使用。请求方式 POST 请求 URL https://cloudapi.linkface.cn/ocr/parse_bankcard_ocr_result 2.请求参数字段类型必需描述 api_id string 是 API 账户 api_secret string 是 API 密钥
/ocr/parse_idcard_ocr_result

1.接口描述对APP端身份证的OCR扫描结果进行解析，并返回解析结果，本接口需要配合APP端SDK使用。请求方式 POST 请求 URL https://cloudapi.linkface.cn/ocr/parse_idcard_ocr_result 2.请求参数字段类型必需描述 api_id string 是 API 账户 api_secret string 是 API 密钥 fi
/ocr/business_license

1.接口描述该 API 用于识别营业执照图像上的文字信息，主要支持横竖两版、三证合一和五证合一。图片要求：格式为 JPG（JPEG），BMP，PNG 宽和高大于 8px，小于等于 4000px 小于等于 1.5 MB，建议300k以内支持自动旋转图片方向：上传的图片中包含有 exif 方向信息，先按此信息旋转、翻转后再进行识别如果照片方向混乱且 exif 方向信息不存在或不正确，自动旋
/ocr/car_plate

1.接口描述该 API 用于识别大陆机动车车牌（包含新能源车牌），返回车牌上的文字信息及车牌在图片中的位置。图片要求：格式为 JPG（JPEG），BMP，PNG 宽和高大于 100px，小于等于 4096px 小于等于 3 MB 请求方式 POST 请求 URL https://cloudapi.linkface.cn/ocr/car_plate 2.请求参数字段类型必需描述 ap
/ocr/vehicle_license

1.接口描述该 API 用于识别静态行驶证图像上的文字信息。图片要求：格式为 JPG（JPEG），BMP，PNG，GIF，TIF 宽和高大于 8px，小于等于 4000px 小于等于 5 MB 请求方式 POST 请求 URL https://cloudapi.linkface.cn/ocr/vehicle_license 2.请求参数字段类型必需描述 api_id string
/ocr/driving_license_v2

1.接口描述该 API 用于识别静态驾驶证图像上的文字信息,可以同时识别正页和副页。图片要求：格式为 JPG（JPEG），BMP，PNG 宽和高大于 100px，小于等于 4000px 小于等于 2 MB 请求方式 POST 请求 URL https://cloudapi.linkface.cn/ocr/driving_license_v2 2.请求参数字段类型必需描述 api_i
/ocr/driving_license

1.接口描述该 API 用于识别静态驾驶证图像上的文字信息。图片要求：格式为 JPG（JPEG），BMP，PNG，GIF，TIFF 宽和高大于 8px，小于等于 4000px 小于等于 5 MB 请求方式 POST 请求 URL https://cloudapi.linkface.cn/ocr/driving_license 2.请求参数字段类型必需描述 api_id string

Pyocr

同类工具

相关阅读

相关文章

相关问答

相关文档