问题：

使用OCR以键值格式从护照图像中提取数据

羊舌富

2023-03-14

我的目标是使用基于OCR服务器的解决方案，以键值格式从护照图像中提取数据，以便数据保留在本地。我尝试了Azure表单识别器容器（认知服务表单识别器API V1预览版）。但结果并不令人满意，因为根据训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据，也参考了https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/build-training-data-set但没用

你能指导我如何以要求的格式提取数据吗？

或者是否有人知道其他任何在服务器上的产品、库或解决方案在商业上或开源上，甚至是在商业上。Net，它最好能在以下方面提供帮助：；

非常感谢您的帮助，谢谢

共有1个答案

仲孙才捷

2023-03-14

你可以考虑这一点：

收集足够的护照样本数据，比如30张图片，代表你要处理的文件。
决定要提取哪个字段，使用表单识别器的标记工具来标记

-新（MS表格识别小组）

类似资料：

PyteSeract或Keras OCR从图像中提取文本

我正在尝试从图像中提取文本。目前我得到的输出是空字符串。以下是我的pytesseract代码，尽管我也对Keras OCR持开放态度：- 我不确定如何使用svg图像，所以我将它们转换为png。下面是一些示例图像：- 编辑1 (2021-05-19)：我可以使用cairosvg将svg转换为png。仍然无法读取验证码文本编辑2（2021-05-20）：Keras OCR也不会为这些图像返回任何内容
使用OCR将表格图像中的单个字段提取到excel

我扫描了一些图像，这些图像有如下所示的表格：我试图分别提取每个框并执行OCR，但当我尝试检测水平线和垂直线，然后检测框时，它会返回以下图像：当我尝试执行其他转换来检测文本（侵蚀和扩张）时，一些残留的线条仍然伴随着文本出现，如下所示：我不能检测文本只执行OCR和正确的边界框不会生成如下所示：我不能使用真正的线条清晰地分开盒子，我已经在一个用油漆编辑的图像上尝试过了（如下所示），以添加数字，并
我想从OCR数据中提取表格信息

我想从OCR数据中提取表格信息，我有原始文本和它的文本。我尝试了pytesseract，但找不到实际的实现。以下是一张图片：https://drive.google.com/open?id=1CGJwbmf5snoXvwlQAsRAxIRRixbT_Q8l 我试过这个：https://github.com/WZBSocialScienceCenter/pdftabextract 这种方法对我根本
无法从PDFA1-a格式文档中提取图像

我使用以下代码从PDFA1格式的pdf中提取图像，但我无法获得图像。我能够使用上述代码提取非标准PDF的图像，但无法提取PDFA1-a格式PDF的图像。似乎是这样的没有返回我甚至尝试过的图像页面。getResources（），但仍然无法获取任何图像。我甚至尝试过使用itext，但它仍然没有给我任何图像。如果我尝试使用以下代码将PDF页面转换为图像这些图像似乎没有与之关联的元数据，因此我仍然
使用Jolt从json数组中提取键/值对

目前我有以下输入json。我想提取值为attrs.name = Details的对象，并将其附加到输出json中(在attrs数组之外)。目前，虽然我能够将它附加到输出JSON中，但我仍然在attrs中得到该对象的副本。我想要这个副本被删除。输入 JSON ：属性。name=“详细信息”可以在attrs中按任意顺序排列输出量的希望值电流输出使用的颠簸规格有没有办法删除仍在 attrs
从byte[]中提取图像元数据

我有一个图像的数据在字节数组中()。我想获取它的元数据，例如： null 我怎么能这么做？如果有图书馆需要我了解，请告诉我。我发现从JPEG中获取字节数组形式的元数据，但它说它与JPEG图像相关。我想对所有图像都这样做。而且，它也没有解释它是如何工作的。

使用OCR以键值格式从护照图像中提取数据

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档