document-ocr 一个相对完整的文档分析和识别项目含以下五部分: 1. 文档分析数据, 2. 识别数据合成工具, 3. 文档版面分析模型, 4. 文本行识别模型, 5. 单字识别模型 Github地址 Gitee地址 数据 数据从网络抓取的公开上市公司年报数据 PDF 文件解析生成,有图片和文本的位置信息 网盘下载地 提取码: nn1g 文本数据是标注到文本行的,部分数据会有些瑕疵,共
要发现GitHub 上的 code contributions 很很容易,但其它的呢?Octohat 可以查出 GitHub 项目上无代码贡献的用户。 Octohat 中输入一个 github repo 名字,它会回复一串和 GitHub 项目有互动,但又没有提交代码的 GitHub 用户。交互包括: 在一个 issue 上 raising 或者 commenting 在一个 pull reque
OpenI-Octopus是一个集群管理工具和资源调度平台,它结合了一些在大规模生产环境中表现良好的成熟设计,主要为提升学术研究效率,复现学术研究成果而量身打造。 特点 基于Kubernetes开发资源调度平台,以镜像方式管理任务运行环境,一次配置随处可用; 针对AI场景设计,AI场景的任务调度和任务启动有一定特殊性,如PS-Worker架构的分布式任务,需要至少满足两个角色的资源请求才能启动任务
oclminer 是 OpenCL 比特币挖矿机
oCanvas 可以帮助你很容易的在 HTML5 的 Canvas 标签上创建对象,并且创建这些对象的动画。支持包括 IE9 以及更新版本和其他包括 FF、Chrome、Safari 和 Opera 浏览器。 该库包含 9 部分: oCanvas Object: which represents the HTML5 Canvas element itself, where everything w
Octopress 是一套使用 Ruby 语言开发的博客网站框架。
Ocara结合领域驱动设计模式,是新一代PHP框架。 除了最基本功能外,提供事务嵌套、多环境配置、分库分表、默认条件、字段别名、常量对象、实体模型、缓存模型化等创新设计,支持API、Restful开发。 复杂概念设计简单化,分散知识积累抽象化!皆源自效率设计。 -- 重新定义PHP框架
Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台。 特性 免费:本项目所有代码开源,完全免费。 方便:解压即用,离线运行,无需网络。 批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。 高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够
GNU Ocrad 是一个 OSR 光学文字识别程序,主要用于文本的识别,支持 pbm、pgm 和 ppm 格式,并输出 UTF-8 和 8位的文本格式。
ocPortal是一个开源PHP内容管理系统(CMS)。拥有相册,新闻,文件下载,社区论坛/聊天室等功能模块。有高效的访问速度并符合专业标准。它的灵活性超强,不仅仅页面管理操作简单,自动处理搜索引擎优化,它还能阻止恶意攻击。 安装方便,易于论坛整合 可随机推荐内容 可统计网站的访问情况 支持会员付费机制 支持多种支付网关 可扩展多种框架 在线投票系统 支持群发
OCaml MySQL Protocol 是 OCaml 实现的 MySQL 数据库协议,用于访问 MySQL 数据库。
OcrPHP 是一个一个简洁优雅的图像识别转换文字的php类库, 须安装tesseract-ocr 使用 composer 安装 { "require": { "fizzday/ocrphp": "dev-master" }} 或者 composer require fizzday/ocrphp 注意: 使用之前必须先安装 tesseract, 安装方法见我的博客 开始使
OCCalendar 是一个非常简单的弹出的日期选择器控件,无需图片,跟屏幕分辨率无关。
ocLazyLoad 是 AngularJS 的延迟加载(惰性加载)模块和组件。 主要特性: 自动加载依赖关系 友好的调试器(无eval代码) 混合正常引导和按需加载的能力 通过服务或指令加载 使用嵌入式异步加载器或使用自己的(requireJS,...) 加载js(有角度或不是)/ css /模板文件 兼容 AngularJS 1.2.x / 1.3.x / 1.4.x / 1.5.x / 1.6.x
Eye 是一个使用 Java 开发的文字识别工具(OCR),该工具主要用来识别屏幕上的文字,不支持中文。