当前位置: 首页 > 知识库问答 >
问题:

如何从.docx/.odt/.doc文件中读取或复制文本

从开济
2023-03-14

在我的应用程序中,我想读取一个文档文件(.doc或.odt或.docx)并将该文本存储在字符串中。为此,我使用下面的代码:

string text;     
using (var streamReader = new StreamReader(@"D:\Sample\Demo.docx", System.Text.Encoding.UTF8))
{
    text = streamReader.ReadToEnd();
}

共有1个答案

陶修洁
2023-03-14

为此,您需要使用不同的库

使用Microsoft.Office.Interop.Word从Word文档读取数据的示例

using System;
using Microsoft.Office.Interop.Word;

class Program
{
    static void Main()
    {
    // Open a doc file.
    Application application = new Application();
    Document document = application.Documents.Open("C:\\word.doc");

    // Loop through all words in the document.
    int count = document.Words.Count;
    for (int i = 1; i <= count; i++)
    {
        // Write the word.
        string text = document.Words[i].Text;
        Console.WriteLine("Word {0} = {1}", i, text);
    }
    // Close word.
    application.Quit();
    }
}
 类似资料:
  • 问题内容: 在某些情况下,我们可能需要从Word文档中获取文本以供将来在用户上传的文档中搜索字符串,例如在cv / resumes中进行搜索,并出现一个常见的问题,即如何获取文本,打开并阅读用户上载Word文档时,有一些有用的链接,但不能解决整个问题。我们需要在上载时获取文本并将文本保存在数据库中,以便在数据库中轻松搜索。 问题答案: class DocxConversion{ private $

  • 我正在尝试从odt文件(用LibreOffice创建)读取数据。需求是获取绑定到文档中包含的XForm的xml。我目前正在使用odfdom-java库读取该文件。到目前为止,我已经设法通过使用jdom解析文档来读取表单字段的值,但我实际想要的是使用表单数据获得整个xml。或者,我可以将文件加载为 。

  • 问题内容: 我知道那里也有类似的问题,但是我找不到能回答我的祷告的东西。我需要的是一种从MS-Word文件访问某些数据并将其保存在XML文件中的方法。在python- docx 上阅读无济于事,因为它似乎只允许一个人写入Word文档,而不是阅读。要准确呈现我的任务(或我选择如何执行任务的方式):我想在文档中搜索关键字或短语(文档包含表格),并从关键字/短语所在的表格中提取文本数据找到了。有人有什么

  • 我面临的例外情况如下: java.lang.nosuchmethoderror:org.apache.xml.utils.DefaulTerrorHandler.(Z)V在org.docx4j.org.apache.xalan.transformer.transformerIdentityImpl.(TransformerIdentityImpl.transformerIdentityImpl.(

  • 我正在使用库python-docx解析docx文件。我需要阅读文档和段落的标题,但是我在文档中找不到任何关于文档标题的东西。有关于将标头写入新文件的文档,但没有关于读取标头的文档。有办法做到这一点吗?

  • 问题内容: 我正在使用像Microsoft Word这样的文档处理项目(学术项目)。 有什么快速的方法来创建我自己的扩展。有没有第三方图书馆? 问题答案: 文件扩展名只是文件名中最后一个句点之后的部分。 例如在路径中: 文件扩展名通常表示文件包含文本数据。要创建自己的文件扩展名,您需要做的就是将所需的扩展名放在文件名中的最后一个句点之后。 在Java中,您可以使用如下类型的对象创建文件: 该文件将