当前位置: 首页 > 知识库问答 >
问题:

使用Pandoc从Tex到word

戴霖
2023-03-14

我需要将Latex文件(使用TexWorks中的Elsevier elsarticle类编写)转换为MS Word文档。我搜索了可能的路线,其中之一就是使用pandoc。我在命令提示符下用pandoc尝试了以下操作,

pandoc -s myfile.tex -o document.docx
pandoc --citeproc myfile.tex --bibliography=mybiblio.bib --csl=ieee.csl -o document.docx

潘多克将文件转换成word文档;然而,一些信息,如标题、关键词、作者详细信息等,却丢失了。对于这个丢失的信息,搜索结果显示它将在元数据中,但我在elsarticle类中找不到任何元数据文件。

我的问题是:如何找到丢失的信息并将其添加到转换后的文件中?

MWE使用elsarticle类编写

\documentclass[preprint,12pt]{elsarticle}

\usepackage{amssymb}


\usepackage{amssymb}
\usepackage{lineno}
\usepackage{graphicx}
\usepackage{subfigure}
\usepackage{amsmath}
\usepackage{times}
\usepackage{float}
\usepackage{tabularx}   
\usepackage{mathptmx}  
\usepackage{moreverb,url}
\usepackage{lineno} 
\usepackage{natbib} 

\usepackage[colorlinks,bookmarks=false,citecolor=black,urlcolor=black]{hyperref}


\begin{document}

\begin{frontmatter}

\title{tex to docx conversion questions using pandoc}

\author{Author 1}
\ead{abc@domain.com}
\author{Author 2\corref{cor1}}
\ead{xyz@domain.com}
\cortext[cor1]{Corresponding author}

\address{University XYZ}

\begin{abstract}
MWE for pandoc query

\end{abstract}


\begin{keyword}

pandoc; \sep tex to word conversion; \sep elsarticle;

\end{keyword}

\end{frontmatter}

\section{Section 1}
Text goes here....

\begin{equation}
\sigma=\frac{3FL}{2bd^2}
\label{eq:FlexuralStress}
\end{equation}

% May insert an image for testing
%\begin{figure}
%\centering
%\includegraphics[width=6cm]{Figures/anyimage}
%\caption{Inserted image for testing conversion}
%\label{image1}
%\end{figure}



\bibliographystyle{agsm}
\bibliography{Mybiblio.bib} 

\end{document}

共有2个答案

谷梁振
2023-03-14

我也遇到过类似的情况,将pandoc生成的PDF文件导入google docs在标题、缩进、项目符号列表等方面都取得了很好的效果。

程钧
2023-03-14

Pandoc解析LaTeX,但不是完整的TeX解释器。按照设计,它不能支持所有包和文档类。elsarticle类需要一个自定义方法来指定元数据,而pandoc不支持该自定义方法。

一个解决方案是使用自定义解析器来提取必要的信息:首先,用-f latexraw_tex调用pandoc,它将保留pandoc中间文档表示中所有不支持的LaTeX命令,但在其他情况下,可以像以前一样工作。然后,内部表示可以通过过滤器进行修改和后处理。

第二种方法是在单独的YAML文件中复制元数据:

---
author:
  - Jane Q. Doe
  - John X. Doe
title: excellent paper
---

然后通过--元数据-file参数将此文件传递给pandoc。

 类似资料:
  • 当我在Pandoc中阅读Markdown时,我如何禁用TeX的东西?我有许多标记文件,我正在处理,但由于文本的存在,它在其中一些文件上窒息,这显然是使用标记式语法。 由于我在这些文本中没有使用任何数学或奇特的排版,我宁愿禁用这种解释,也不愿试图找出正确的方法来逃避实际上触发它的序列。 但如果这不可能,我很想知道逃离@的“正确”方式,不管是什么正确方式。可能是“@”?还是有更多我不知道的德克萨斯式语

  • 我试着用pandoc在html或epub中转换我的tex文件。它不是一个复杂的带数学格式的乳胶文件。它有点像一本书。 但是我有一个问题。当我用转换pdf中的文件时,所有文件都可以。但是当我使用 或 pandocbook.texbook.epub 就好像没有汇编一样<代码> 事实上,这就像我做了一个简单的复制和粘贴,没有命令。

  • 我试图通过使用Pandoc: 将html转换为docx,这是我的html代码: 与MathJax配置在头: 我使用的Pandoc命令(Pandoc版本2.2.3.2): 然后我得到一个警告: 有人告诉我怎么解决这个问题。谢谢

  • 在降价文档中编写TeX公式并使用pandoc(1.18版)将其转换为实际的排版公式很容易,可以是PDF文档(通过LaTeX)或HTML文档(通过MathJax):在

  • Pandoc 可将多种文档格式,包括:markdown, reStructuredText, textile, HTML, DocBook, or LaTeX 转成: HTML formats: XHTML, HTML5, and HTML slide shows using Slidy, Slideous, S5, or DZSlides. Word processor formats: Mic

  • 我有一个html文档 在一些段落中,我有 我希望带$符号的文本使用KaTeX呈现为TeX math。 问题是,如果我想在浏览器中使用它,我必须使用 所以我需要分配一个元素。 那么,我真的应该这样编写html文档,还是有其他选择: 对每个配方重复相同的模式? 这似乎有点奇怪,我不能只写文本并用tex渲染的输出替换所有文本公式。 例如,汗学院是如何在这个页面上结合文本和公式的?他们是否在服务器上呈现所