当前位置: 首页 > 软件库 > 程序开发 > OCR开发包 >

darknet-ocr

中文自然场景文字检测及识别
授权协议 MIT
开发语言 C/C++
所属分类 程序开发、 OCR开发包
软件类型 开源软件
地区 不详
投 递 者 万俟经纶
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

darknet-ocr 是基于 darknet 框架,实现 CTPN 版本自然场景文字检测与 CNN+CTCOCR 文字识别的项目。目前支持系统:mac/ubuntu python=3.6

实现功能

  • [x] 文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)
  • [x] 支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
  • [x] 不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)
  • [x] 支持darknet 转keras, keras转darknet, pytorch 转keras模型
  • [x] 身份证/火车票结构化数据识别
  • [x] 新增CNN+ctc模型,支持DNN模块调用OCR,单行图像平均时间为0.02秒以下
  • [ ] CPU版本加速
  • [ ] 支持基于用户字典OCR识别
  • [ ] 新增语言模型修正OCR识别结果
  • [ ] 支持树莓派实时识别方案

ocr 训练数据集(压缩包解码:chineseocr)

百度网盘链接:https://pan.baidu.com/s/1UcUKUUELLwdM29zfbztzdw 提取码: atwn

gofile 地址:http://gofile.me/4Nlqh/uT32hAjbx 密码 https://github.com/chineseocr/chineseocr

环境部署

GPU部署 参考:setup.md
CPU部署 参考:setup-cpu.md

下载编译 darknet

git clone https://github.com/pjreddie/darknet.git 
mv darknet chineseocr/
##编译对GPU、cudnn的支持 修改 Makefile
#GPU=1
#CUDNN=1
#OPENCV=0
#OPENMP=0
make 

修改 darknet/python/darknet.py line 48
root = '/root/'##chineseocr所在目录
lib = CDLL(root+"chineseocr/darknet/libdarknet.so", RTLD_GLOBAL)

下载模型文件

模型文件地址:

模型转换(非必须)

pytorch ocr 转 keras ocr

python tools/pytorch_to_keras.py  -weights_path models/ocr-dense.pth -output_path models/ocr-dense-keras.h5

darknet 转 keras

python tools/darknet_to_keras.py -cfg_path models/text.cfg -weights_path models/text.weights -output_path models/text.h5

keras 转 darknet

python tools/keras_to_darknet.py -cfg_path models/text.cfg -weights_path models/text.h5 -output_path models/text.weights

模型选择

参考config.py文件

构建 Docker 镜像

##下载Anaconda3 python 环境安装包(https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh) 放置在chineseocr目录下   
##建立镜像   
docker build -t chineseocr .   
##启动服务   
docker run -d -p 8080:8080 chineseocr /root/anaconda3/bin/python app.py

Web 服务启动

cd chineseocr## 进入chineseocr目录
python app.py 8080 ##8080端口号,可以设置任意端口

访问服务

http://127.0.0.1:8080/ocr

  • 原文:https://www.csdn.net/gather_2b/MtjaMg3sNTY5Ni1ibG9n.html     OCR技术系列 身份证识别 深度学习实践系列之--身份证上汉字及数字识别系统的实现 https://github.com/Raymondhhh90/idcardocr:web部署,第二代居民身份证信息识别,速度略慢,待优化 https://github.com/wzb19

  • ScreenCapturer.h #ifndef SCREENCAPTURER_H #define SCREENCAPTURER_H #include "mainwindow.h" // 它是QWidget的子类 class ScreenCapturer : public QWidget { //并且在类主体的开头具有Q_OBJECT宏 Q_OBJECT public:

 相关资料
  • 树洞 OCR 文字识别是一款跨平台的 OCR 小工具 下载地址:百度网盘 提取码:m6d8 xxx-with-jre.xx 是完整版,带运行环境;如果精简版不能正常工作,请下载完整版使用; 文字识别使用了各云平台开发的识别接口,因此需要联网才能正常使用; 安装路径请勿包含中文字符; 本程序使用 JavaFX 开发,使用前请务必安装 Java8 运行环境(完整版无需安装 Java8)。 程序使用 启

  • 本文向大家介绍java实现百度云OCR文字识别 高精度OCR识别身份证信息,包括了java实现百度云OCR文字识别 高精度OCR识别身份证信息的使用技巧和注意事项,需要的朋友参考一下 本文为大家分享了java实现百度云OCR识别的具体代码,高精度OCR识别身份证信息,供大家参考,具体内容如下 1.通用OCR文字识别 这种OCR只能按照识别图片中的文字,且是按照行识别返回结果,精度较低。 首先引入依

  • 本文向大家介绍Python文字截图识别OCR工具实例解析,包括了Python文字截图识别OCR工具实例解析的使用技巧和注意事项,需要的朋友参考一下 一、简介 你一定用过那种“OCR神器”,可以把图片中的文字提取出来,极大的提高工作效率。 今天,我们就来做一款实时截图识别的小工具。顾名思义,运行程序时,可以实时把你截出来的图片中的文字识别出来。 二、模块 三、获取百度应用接口 AI开放平台文档中心

  • 主要内容:如何编写测试场景,测试场景的特征测试场景是测试用例的详细文档,涵盖了线性语句中软件应用程序的端到端功能。线性语句被视为一种场景。测试场景是可测试需求的高级分类。这些要求根据模块的功能进行分组,并从用例中获取。 在测试场景中,由于许多相关的测试用例,因此存在详细的测试过程。在执行测试场景之前,测试人员必须考虑每个场景的测试用例。 在测试场景中,测试人员需要将自己置于用户的位置,因为他们在用户的角度下测试软件应用程序。场景的准备是最

  • 接口说明 查询场景(分页查询场景列表,带有检测示例场景功能) 如需调用,请访问 开发者文档 来查看详细的接口使用说明 该接口仅开放给已获取SDK的开发者 API地址 GET /wish3dearth/api/scene/v1.0.0/pageList 是否需要登录 是 请求字段说明 参数 类型 请求类型 是否必须 说明 token string header 是 当前登录用户的TOKEN titl

  • 接口说明 查询场景(分页查询场景列表,带有检测示例场景功能) 如需调用,请访问 开发者文档 来查看详细的接口使用说明 该接口仅开放给已获取SDK的开发者 如开启https功能,请求地址的协议应改为https,如:https://www.example.com/wish3dearth/api/access/v1.0.0/getLicenseInfo API地址 GET /wish3dearth/ap