当前位置: 首页 > 工具软件 > pytesser > 使用案例 >

用于图片文本识别的pytesser3的安装说明(windows10)

沃盛
2023-12-01

pytesser3包是支持python3的pytesser,后者是谷歌OCR开源项目的一个模块,在python中导入这个模块会调用tesseract, 即可将图片中的文字转换成文本。

下面讲讲pytesser3的安装问题。

1. 安装前准备

安装pytesser3之前首先需要安装好Python3, PIL库,Tesseract-OCR


2. 安装pytesser3

pytesser3可以直接使用 pip进行安装

pip install pytesser3

安装完成后,在python中输入

import pytesser3

如果没有出错的话,说明安装成功了。


3. 修改 __init__.py

修改pytesser3文件夹中的__init__.py文件。

将其中的tesseract_exe_name值设为tesseract.exe所在的文件夹路径。

tesseract_exe_name = 'D:\\tesseract\\Tesseract-OCR\\tesseract'

如果不修改的话,pytesser3将无法调用tesseract。


4. 修改util.py文件,解决'gbk'编码问题

具体内容详见:

python3 + pytesser3 识别验证码过程中‘gbk'’编码问题的解决

 类似资料: