当前位置: 首页 > 知识库问答 >
问题:

使用java从用于OCR的图像中读取表单字段

堵雅健
2023-03-14

我只是从图像中提取文本,但当我试图处理表单时,由于表单边界,该程序无法用于字符提取。如何从包含边界的表单中提取字符?

共有1个答案

唐煜
2023-03-14

识别表单中的行,收集它们在数组中的位置,并使用ImageIO在不考虑数组中的值的情况下写入图像。写

 类似资料:
  • 我扫描了一些图像,这些图像有如下所示的表格: 我试图分别提取每个框并执行OCR,但当我尝试检测水平线和垂直线,然后检测框时,它会返回以下图像: 当我尝试执行其他转换来检测文本(侵蚀和扩张)时,一些残留的线条仍然伴随着文本出现,如下所示: 我不能检测文本只执行OCR和正确的边界框不会生成如下所示: 我不能使用真正的线条清晰地分开盒子,我已经在一个用油漆编辑的图像上尝试过了(如下所示),以添加数字,并

  • 问题内容: 佳能/尼康/其他相机将传感器的原始输出保存为某些专有格式(.CR2等)。是否有旨在读取它们并将其转换为可管理的BufferedImages的Java库? 在这里,我不需要关心完全可定制的转换(类似于ufraw或imagemagick),而是“可以正常工作”以渲染此类图像的简单预览的简单方法。 问题答案: 我去过你那里,我对你有感觉。最好的选择是使用基于Adobe或dcraw的程序自动创

  • 问题内容: 有没有办法使用Java从https网址获取图像? 到目前为止,我正在尝试: 但是,我得到: 我该如何处理?我必须提取该URL上的6k张图像以上。 问题答案: 有两个问题。您可以使用浏览器访问该网站,并查看错误。 服务器证书是自签名的,不受Java信任。您可以将其添加到信任库。 服务器证书与主机名“ ns6.host.md”不匹配,因此您需要一个忽略它的证书。 另一个答案也是如此,它提供

  • 我的目标是使用基于OCR服务器的解决方案,以键值格式从护照图像中提取数据,以便数据保留在本地。我尝试了Azure表单识别器容器(认知服务表单识别器API V1预览版)。但结果并不令人满意,因为根据训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据,也参考了https://docs.microsoft.com/en-us/azure/cognitive-services/form-rec

  • 我有一个表单的图像,其中包含不同的字段,如名称,数字,地址等。我想从这些字段中识别数据并将其保存到数据库。现在,我的OCR工作正常,但我不知道如何从图像中提取特定的字段数据(名称,地址)用于OCR。简单地说,我想知道如何识别输出文件中的字符是来自名称字段或地址字段或任何其他字段。

  • 我正在尝试从图像中提取文本。目前我得到的输出是空字符串。以下是我的pytesseract代码,尽管我也对Keras OCR持开放态度:- 我不确定如何使用svg图像,所以我将它们转换为png。下面是一些示例图像:- 编辑1 (2021-05-19):我可以使用cairosvg将svg转换为png。仍然无法读取验证码文本 编辑2(2021-05-20):Keras OCR也不会为这些图像返回任何内容