当前位置: 首页 > 工具软件 > pytesser > 使用案例 >

[Python] 识别图像中的文字--pytesser模块

龙繁
2023-12-01

安装pytesser

  1. 安装PIL

     pip2 install numpy
     pip2 install pillow
    
  2. 下载安装包,放入以下文件夹(链接:https://pan.baidu.com/s/1kWjYeN1 密码:7m8p)

     C:\Python27\ArcGIS10.2\Lib\site-packages\pytesser
    
  3. pytesser.py文件名修改为__init__.py

  4. 打开第三步的文件

     import Image 
     #修改为 
     from PIL import Image
    
     tesseract_exe_name = 'tesseract'
     # 修改为
     tesseract_exe_name = r'C:\Python27\ArcGIS10.2\Lib\site-packages\pytesser\tesseract' # Name of executable to be called at command line
    
  5. 测试

     import pytesser
     # 未报错即成功
    

使用

识别简单英文与数字可以,识别中文不行

from pytesser import *
# 法一
im = Image.open(r'E:\user\Desktop\test_cmd.png')
text = image_to_string(im)
print text
# 法二
text = image_file_to_string(r'E:\user\Desktop\test_cmd.png',graceful_errors=True)
print text
# 使用ImageEnhance可以增强图片的识别率
image = Image.open(r'E:\user\Desktop\test_cmd.png')
enhancer = ImageEnhance.Contrast(image)
image_enhancer = enhancer.enhance(4)
print image_to_string(image_enhancer)

识别中文字符博客:https://www.cnblogs.com/semishigure/p/7690789.html

 类似资料: