当前位置: 首页 > 软件库 > 程序开发 > OCR开发包 >

ocrstyle

图片识别文字
授权协议 BSD
开发语言 C/C++
所属分类 程序开发、 OCR开发包
软件类型 开源软件
地区 国产
投 递 者 宗政才俊
操作系统 Windows
开源组织
适用人群 未知
 软件概览

 

Optical Character Recognition

背景

本程序最初是想用于发票识别的,目前可以通过ocrengine和imageprocess动态库进行二次开发。

功能

  • 图片识别文字的软件。
  • 支持截图。
  • 支持选择识别的区域。
  • 支持选择识别的语言。
  • 支持倾斜纠正。
  • 支持保存识别的文字。
  • 支持多种语言的识别,内置了中文和英文,可以根据需要下载其它语言。

编译环境

  • ocrstyle 使用的Qt4.8开发的。
  • ocrengine 使用Visual C++ Express 2008开发的。这个工程依赖third-party目录下的Tesseract OCR开发库,目前是google维护的,当时开发的时候官方只有VC2008的开发库,于是就用的VC2008开发了。项目地址:http://code.google.com/p/tesseract-ocr/。
  • imageprocess 使用的Visual C++ Express 2010开发的。这个工程依赖于OpenCV。项目地址:http://opencv.org/
  • buildscripts/ocrstyle.nsi 打包安装包使用的NSIS。

动态库的接口

  • ImageProcessAPI.h 主要功能:图像的加载、灰度处理、倾斜校正、保存等。
  • OCREngine.h 主要功能:配置识别的语言、传入要识别的图像数据、获得文本。

思路

  • 扫描的电子发票一般都有点倾斜,所以要对图片进行倾斜校正。为了方便识别需要进行灰度处理。
  • 一般是要识别发票上的部分内容,所以要想办法把要识别的文本区域的图像数据传给Tesseract OCR,然后获得文本。

 

 相关资料
  • 本文向大家介绍C#二维码图片识别代码,包括了C#二维码图片识别代码的使用技巧和注意事项,需要的朋友参考一下 本文实例为大家分享了C#二维码图片识别的具体代码,供大家参考,具体内容如下 怎么用NuGet和怎么配置log4net就不介绍了,直接上代码(Visual Studio 2015 下的项目,用的.NET Framework 4.5.2)。 其中QRDecodeConsoleApp.exe.co

  • 假设我拍摄了一张400*800像素的照片。我知道如何将这张照片从一种密度转换为另一种密度。但哪一个是第一个(当我创建新图片时)?

  • 本文向大家介绍C#识别出图片里的数字和字母,包括了C#识别出图片里的数字和字母的使用技巧和注意事项,需要的朋友参考一下 一个图片识别小工具,原先主要是识别以前公司的软件注册码截图里的数字和字母(每次要一个一个框复制出来粘贴到注册器里,很麻烦!),因为注册码出现的字母和数字基本就那几个,所以识别库的范围设定的比较少。 原理和算法在代码中做了详细说明,功能存在很大的局限性,但我的想法是把这个思路和实现

  • 更新时间:2019-07-19 10:48:36 节点简介 人脸识别/图像识别/OCR节点属于智能节点,区别在于封装的云市场api功能不同。人脸识别节点主要有人数检测、人脸身份证对比、性别年龄情绪识别等功能。图像识别节点主要有烟雾火焰火灾识别、动物识别、植物识别、植物花卉识别等功能。OCR节点主要有驾驶证识别、车牌识别、身份证识别等功能。 使用场景 如果您需要进行人数检测、人脸身份证对比、性别年龄

  • 本文向大家介绍c#实现识别图片上的验证码数字,包括了c#实现识别图片上的验证码数字的使用技巧和注意事项,需要的朋友参考一下 C#识别验证码图片通用类 以上2则都是使用C#实现的orc识别的代码,希望对大家学习C#有所帮助。

  • TensorFlow包含图像识别的特殊功能,这些图像存储在特定文件夹中。出于安全目的,经常要识别相同的图像,这个逻辑很容易实现。 图像识别代码实现的文件夹结构如下所示 - dataset_image 文件夹中包含需要加载的相关图像。这里将专注于图像识别,其中定义了徽标。加载“load_data.py”脚本,它记录各种图像识别模块。 图像的训练用于将可识别的图案存储在指定的文件夹中。 上面的代码行生