介绍:Python-tesseract是python的光学字符识别(OCR)工具。也就是说,它将识别并“读取”嵌入图像中的文本。
Python-tesseract是Google的Tesseract-OCR引擎的包装器。它作为独立的调用脚本也很有用,因为它可以读取Python Imaging Library支持的所有图像类型,包括jpeg,png,gif,bmp,tiff等,而tesseract-ocr默认只支持tiff和bmp。此外,如果用作脚本,Python-tesseract将打印已识别的文本,而不是将其写入文件。
快速开始
try:
import Image
except ImportError:
from PIL import Image
import pytesseract
#如果PATH中没有tesseract可执行文件,请包含以下内容:
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
#示例tesseract_cmd = r'C:\ Program Files(x86)\ Tesseract-OCR \ tesseract'
#简单的图像串
print(pytesseract.image_to_string(Image.open('test.png')))
#法语文本图像串
print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))
#获取包围盒估计
print(pytesseract.image_to_boxes(Image.open('test.png')))
#获取详细的数据,包括盒,置信线和页码
print(pytesseract.image_to_data(Image.open('test.png')))
#获取有关方向和脚本检测信息
print(pytesseract.image_to_osd(Image.open('test.png'))
#为了绕过内部图像的转换,只需用相对或绝对图像路径
#注:如果你不使用支持的图像,正方体将返回错误
print(pytesseract.image_to_string('test.png'))
支持OpenCV image / NumPy数组对象
import cv2
img = cv2.imread(r'/<path_to_image>/digits.png')
print(pytesseract.image_to_string(img))
#或显式转换预先
print(pytesseract.image_to_string(Image.fromarray(img))
如果您有tessdata错误,请添加以下配置:“打开数据文件时出错......”
tessdata_dir_config = r ' - tessdata-dir“<replace_with_your_tessdata_dir_path>”'
#示例config:r' - tessdata-dir“C:\ Program Files(x86)\ Tesseract-OCR \ tessdata”'
#添加双引号很重要在dir路径附近。
pytesseract.image_to_string(image, lang='chi_sim', config=tessdata_dir_config)
功能
参数
image_to_data(image,lang = None,config ='', nice = 0,output_type = Output.STRING)
先决条件:
通过点子安装:
有关更多信息,请查看pytesseract包页面。
$ ( env ) > pip install pytesseract
或者如果你安装了git:
$ ( env ) > pip install -U git + https://github.com/madmaze/pytesseract.git
从源代码安装:
$> git clone https://github.com/madmaze/pytesseract.git
$ ( env ) > cd pytesseract && pip install -U。