当前位置: 首页 > 知识库问答 >
问题:

使用OCR以键值格式从护照图像中提取数据

羊舌富
2023-03-14

我的目标是使用基于OCR服务器的解决方案,以键值格式从护照图像中提取数据,以便数据保留在本地。我尝试了Azure表单识别器容器(认知服务表单识别器API V1预览版)。但结果并不令人满意,因为根据训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据,也参考了https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/build-training-data-set但没用

你能指导我如何以要求的格式提取数据吗?

或者是否有人知道其他任何在服务器上的产品、库或解决方案在商业上或开源上,甚至是在商业上。Net,它最好能在以下方面提供帮助:;

非常感谢您的帮助,谢谢

共有1个答案

仲孙才捷
2023-03-14

你可以考虑这一点:

  1. 收集足够的护照样本数据,比如30张图片,代表你要处理的文件
  2. 决定要提取哪个字段,使用表单识别器的标记工具来标记

-新(MS表格识别小组)

 类似资料:
  • 我正在尝试从图像中提取文本。目前我得到的输出是空字符串。以下是我的pytesseract代码,尽管我也对Keras OCR持开放态度:- 我不确定如何使用svg图像,所以我将它们转换为png。下面是一些示例图像:- 编辑1 (2021-05-19):我可以使用cairosvg将svg转换为png。仍然无法读取验证码文本 编辑2(2021-05-20):Keras OCR也不会为这些图像返回任何内容

  • 我扫描了一些图像,这些图像有如下所示的表格: 我试图分别提取每个框并执行OCR,但当我尝试检测水平线和垂直线,然后检测框时,它会返回以下图像: 当我尝试执行其他转换来检测文本(侵蚀和扩张)时,一些残留的线条仍然伴随着文本出现,如下所示: 我不能检测文本只执行OCR和正确的边界框不会生成如下所示: 我不能使用真正的线条清晰地分开盒子,我已经在一个用油漆编辑的图像上尝试过了(如下所示),以添加数字,并

  • 我想从OCR数据中提取表格信息,我有原始文本和它的文本。我尝试了pytesseract,但找不到实际的实现。 以下是一张图片:https://drive.google.com/open?id=1CGJwbmf5snoXvwlQAsRAxIRRixbT_Q8l 我试过这个:https://github.com/WZBSocialScienceCenter/pdftabextract 这种方法对我根本

  • 我使用以下代码从PDFA1格式的pdf中提取图像,但我无法获得图像。 我能够使用上述代码提取非标准PDF的图像,但无法提取PDFA1-a格式PDF的图像。似乎是这样的 没有返回我甚至尝试过的图像页面。getResources(),但仍然无法获取任何图像。我甚至尝试过使用itext,但它仍然没有给我任何图像。 如果我尝试使用以下代码将PDF页面转换为图像 这些图像似乎没有与之关联的元数据,因此我仍然

  • 目前我有以下输入json。我想提取值为attrs.name = Details的对象,并将其附加到输出json中(在attrs数组之外)。目前,虽然我能够将它附加到输出JSON中,但我仍然在attrs中得到该对象的副本。我想要这个副本被删除。 输入 JSON : 属性。name=“详细信息”可以在attrs中按任意顺序排列 输出量的希望值 电流输出 使用的颠簸规格 有没有办法删除仍在 attrs

  • 我有一个图像的数据在字节数组中()。我想获取它的元数据,例如: null 我怎么能这么做?如果有图书馆需要我了解,请告诉我。 我发现从JPEG中获取字节数组形式的元数据,但它说它与JPEG图像相关。我想对所有图像都这样做。而且,它也没有解释它是如何工作的。