当前位置: 首页 > 知识库问答 >
问题:

使用表单识别器客户端库使用C#代码无法从跨多个页面的pdf文件中读取相同的表数据

曾嘉祯
2023-03-14

我无法读取跨越下一页的表格数据。我正在使用c#代码,通过FormRecognizerClient和在控制台应用程序中使用经过培训的自定义模型来提取数据。还尝试了使用StartReconficeInVoicesFromuriAsync,即使用FormReconfizerClient的分析发票,但在上述场景中也失败了。

在C#中的Form识别器客户端也不能识别表中的头。我正在使用下面的链接为Form识别器客户端C#库代码,https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/client-library?tabs=preview,v2-1

正在寻求帮助。

以下是显示pdf格式的图像链接:https://i.stack.imgur.com/mx5NW.png

共有1个答案

宋志学
2023-03-14

表单识别器还不支持跨页面的表,并将每页提取每个表。您能否在第二页共享一个未检测到的表片段(请匿名所有数据并在共享前编辑所有数据

 类似资料:
  • 我正在使用来自识别器的Azure进行发票处理项目。所有发票均为PDF格式。我正在使用带有标签的自定义表单识别器。我可以从PDF中提取一些数据,如发票号、发票日期、金额等,但我想使用Azure Form Recognitor从PDF中提取表格数据,但它无法正确读取表格。 我已经标记了我需要的单元格,当表中的行数增加时,它会正确读取列,但是它无法将每行的值彼此分开,并将整列作为单个值返回。 我试图提供

  • 我有不同类型的pdf,其中包含多个内容,如文本,表格等。该表可以存在于pdf的任何位置(顶部,中间,底部)。我只想提取表数据(不。的列,没有。行数 到目前为止我所做的工作:- 1.我使用了iText java API来读取和提取。使用以下代码:- pdftextextractor . gettextfrompage 但它只是以文本形式返回数据。没有得到任何线索来确定表格在pdf中的位置以及如何从该

  • 我有一个生成PDF文件的系统,每个文件由两页组成。出于某种原因,我需要编写一个PHP代码,可以从每个PDF文件中删除第二页。以下是我所做的以及结果: 1-我使用TCPDF库编写了以下代码: 结果:空白一页PDF文件。换句话说原始文件中的内容在新文件中不可用 2-我使用FPDF和FPDI库从原始文件中只读取一页。 结果是出现以下错误消息: 带有消息的未捕获异常异常此文档(test.pdf)可能使用了

  • 我正在尝试使用JAVA填写PDF表单,但当我尝试使用下面的代码获取字段时,列表为空。 然后我尝试使用PDFStripper读取文件 输出如下 “请稍候。。。 如果此消息最终未被文档的正确内容替换,则PDF查看器可能无法显示此类文档。 您可以通过访问升级至最新版本的Adobe Reader for Windows®、Mac或Linux®http://www.adobe.com/go/reader_d

  • 我已经成功地开发了一项服务,在该服务中,我阅读了在泽西岛以多部分形式上传的文件。以下是我所做工作的一个极其简化的版本: 这很好,但我有一个新的要求。除了上传的文件,我还需要处理任意数量的资源。假设这些是图像文件。 我想我应该为客户端提供一个表单,其中包含文件的一个输入,第一个图像的一个输入,以及允许向表单添加更多输入的按钮(使用AJAX或简单的纯JavaScript)。 因此,用户可以在表单中附加

  • 下面的代码行用于在C#中打开特定页面的PDF文件。除了最新的11个版本之外,所有adobe版本的代码都能正常工作。