我想编写一个通用方法,通过循环段落和形状来提取从word文档到文本文件的所有内容。
我能够使用下面的代码解析90%的文档。但是,此代码不会读取少数表中的内容。
Set objWordApp = CreateObject("Word.Application")
objWordApp.Visible = False
Set objWordDoc = objWordApp.Documents.Open(strWordDocPath)
Set objFso = CreateObject("Scripting.FileSystemObject")
Set oFile = objFso.createTextFile(strTextFilePath)
Set colParagraphs = objWordDoc.Paragraphs
For Each objParagraph In colParagraphs
lineText =Trim(objParagraph.Range.Text)
If lineText <> "" Then
oFile.Write lineText & vbCrLf
end if
next
我无法从MS word文档中提取表格中的少量文本。这个问题只涉及一些文本和表格,我可以用我的代码阅读文档中的大部分内容。
Word文档位于以下链接中-
https://drive.google.com/file/d/0B1C7jj9dLG2aTXJNRGt6QTBVUUE/view?usp=sharing
主要问题是如何解析文档中的第一个表。此文档由应用程序生成,我无法控制内容的格式。
有人能帮我从附加文档中阅读完整的内容吗?
以下是给你的线索:
Sub test()
Dim tCel As Cell, cellText As String
For Each tCel In ActiveDocument.Shapes(1).TextFrame.TextRange.Tables(1).Range.Cells
cellText = Trim(tCel.Range.Text)
Debug.Print cellText
Next
End Sub
我已经很多年没有使用VB了,所以如果这是显而易见的,请原谅我。我正在尝试编写一个word vba宏,以便在模板中使用,该模板将显示一个userform,然后导入fileA的内容。docx,fileB。docx或fileC。docx取决于用户表单。(之后我将使用书签填写一些表单数据,我不知道这是否相关)。文件A、B和C将包含一些基本格式(如列表)的文本,但没有什么特别之处。 我在网上看到的解决方案可
我使用SOLR7完全解压缩windows文档文件。我有这个错误: 但是使用Solr5.5我没有错误,知道吗?
我有一个当前格式的文档 标题 字幕 H1 样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本 H2 样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本样本文本 H3 样本文本样本文本样本文本样本文本样本文
我有一个word文档,其中包含许多由html标记定义的html文档。我想创建一个数组或范围集合,每个范围由一个html文档组成。例如,以下是Word文档: 等等。我想用一系列范围来填充rngHTMLDocs()As Range,每个范围包含每个打开和关闭html标记中的文本。 我创建了以下代码,试图遍历定义这些范围的整个文档,但它只继续选择超文本标记语言Doc 1。我想我可能以错误的方式接近整个迭
问题内容: 有没有一种方法可以使用Python有效地获取Word文档(.doc,.docx)的页数? 对于.odt文件? 我想将此用于基于Linux的Web2py的Web应用程序。 谢谢 ! 问题答案: 您可以读取该值 来自docx包中的docProps / app.xml或 在odt包中形成meta.xml。 如果这些值不存在(它们是可选的),则必须对整个文档进行计算,实际上是执行渲染,这要困难
有没有办法用Python高效地获取word文档(.doc、.docx)的页数? 还有一次。odt文件? 我想把它用于Linux上基于Web2py的web应用程序。 非常感谢。