当前位置：首页 > 面试题库 >

如何将pdf文件转换为CSV文件？

孟均

2023-03-14

问题内容：

我想将PDF文件转换为CSV文件。我为此使用iText库。程序运行正常，但输出格式不正确。所有数据都在csv文件的第一行中。输出应与pdf文件完全相同（表示带有换行符）。请帮忙。提前致谢。

Document document = new Document();
  document.open();
  PdfReader reader = new PdfReader("C:\\Indiaops-projects\\PREMIUM_PAID_ACKNOWLEDGEMENT.pdf");
  PdfDictionary dictionary = reader.getPageN(1);
  AcroFields fileds = reader.getAcroFields();
  PRIndirectReference reference = (PRIndirectReference) 
            dictionary.get(PdfName.CONTENTS);
                    PRStream stream = (PRStream) PdfReader.getPdfObject(reference);
                    byte[] bytes = PdfReader.getStreamBytes(stream);
                    PRTokeniser tokenizer = new PRTokeniser(bytes);
                    FileOutputStream fos=new FileOutputStream("C:\\Indiaops-projects\\pdf.csv");
                    StringBuffer buffer = new StringBuffer();
                    StringBuffer data = new StringBuffer();
                    int i=0;
                    while (tokenizer.nextToken()) {
                    if (tokenizer.getTokenType() == PRTokeniser.TK_STRING) {
                        String value = tokenizer.getStringValue();

                        if("x-none".equals(value)){
                            String datastr =data.toString();
                            if(!"".equals(datastr)){
                                buffer.append("\""+datastr+"\",");
                                data = new  StringBuffer();
                            }
                        }else{
                               data.append(value);
                        }
                     }
                  }
            String test=buffer.toString();
            StringReader stReader = new StringReader(test);
            int t;
            while((t=stReader.read())>0)
            fos.write(t);
            document.add(new Paragraph(".."));
            document.close();

问题答案：

您需要在每个表行之后在缓冲区中引入一个换行符’\ n’。

buffer.append("\n");

类似资料：

如何将xlsx文件转换为CSV？
如何用C#将XML文件转换为CSV文件

给我最好的方式来写代码。如何在C#中将XML文件转换为CSV文件，只显示以下标记：输出CSV文件格式应如下所示：
将HTML文件转换为PDF

问题内容：按照目前的情况，这个问题并不适合我们的问答形式。我们希望答案得到事实，参考或专业知识的支持，但是这个问题可能会引起辩论，争论，民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出，请访问帮助中心以获取指导。 7年前关闭。我需要从现有的（X）HTML文档自动生成PDF文件。输入文件（报告）使用非常简单的基于表的布局，因此可能不需要支持真正精美的JavaScript / CSS。
我们如何将XML文件转换为CSV？

问题内容：我有一个XML文件我必须将此XML转换为CSV文件。我听说我们可以使用XSLT进行此类操作。如何在Java中（带有/不带有XSLT）执行此操作？问题答案：用伪代码：这个快速的小循环将在每行的末尾写一个逗号，但是我敢肯定您可以弄清楚如何删除它。为了实际解析XML，我建议使用JDOM。它具有非常直观的API。
如何将CSV文件转换为多行JSON？

问题内容：这是我的代码，非常简单的东西… 声明一些字段名称，阅读器使用CSV读取文件，并使用字段名称将文件转储为JSON格式。这是问题所在… CSV文件中的每个记录都在不同的行上。我希望JSON输出采用相同的方式。问题在于，将其全部倾倒在一条长长的巨线上。我试过使用类似的代码，然后在该代码下面运行我的代码，该代码循环遍历每一行，但它在一行上执行整个文件，然后在另一行上遍历整个文件…一直持续到行
如何使用Java将pdf文件转换为word文件

问题内容：如何使用Java将pdf文件转换为word文件？而且，它看起来像它一样容易吗？问题答案：试试PDFBOX

相关阅读

将PDF文件转换为图像 Java将HTML文件转换为PDF 如何将.txt / .csv文件转换为ORC格式如何使用Java将PNG文件转换为PDF？如何将Word文档转换为PDF？

相关文章

PDFBox创建PDF文档 VBA文本文件【华为OD机试2023】区块链文件转储系统Python PDFBox PDF文档中的JavaScript 将比特币转换为菲亚特货币

相关问答

将UTF-8 csv文件转换为Excel可读csv 如何将多部分文件转换为文件？如何将核心文件转换为hyprof文件如何将文件URI转换为文件路径？将多个.txt文件转换为单个.csv文件（python）

相关工具

汉字转换为拼音邮件发送Document文件文件安全卫士雪梦文件管理器皆杀文件搜索器

相关文档

Element UI 组件中文文档 MOYE 知心组件库中文文档 Element React 组件帮助中文文档 Element Angular 组件帮助中文文档 Windows 共享文件夹帮助文档