当前位置: 首页 > 知识库问答 >
问题:

使用pandoc ruby将HTML和内联Mathjax math转换为LaTeX

巩才捷
2023-03-14

我正在构建一个Rails应用程序,我正在寻找一种方法,将带有html和内联MathJax math(TeX)的数据库条目转换为LaTeX,以便创建pdf。

我发现了类似的问题:

  • 使用pandoc将html mathjax转换为markdown
  • 如何使用pandoc将带有mathjax的HTML转换为latex

我在这里看到两个选择:

  • 创建一个Haskell可执行文件,在将html转换为LaTeX时,它会将\(y=f(x)\)之类的内容单独保留下来
  • 编写一个ruby方法,它可以执行以下操作:
    • 字符串,用正则表达式(string.split(regex))将其拆分为数组
    • 循环浏览创建的数组,如果内容与regex匹配,则将不包含内联数学的部分转换为LaTeX。html(字符串)。到_乳胶
    • 将所有内容重新连接在一起(array.join

    我更喜欢ruby方法解决方案,因为我在Heroku上托管我的应用程序,我不喜欢将二进制文件签入git
    注意:pandoc二进制文件是这样实现的http://www.petekeen.net/introduction-to-heroku-buildpacks)

    所以我的问题是:用\(数学\)拆分字符串regex应该是什么样子。

    例如,string可以是这样的:text\(y=f(x)\iff\log\u{10}(b)\)和\(ab=c\)text

    为了完整起见,应该如何编写Haskell脚本,以便在转换为LaTeX时不使用\(数学\),并且ruby方法不是一个可能的解决方案?

共有1个答案

宰父君昊
2023-03-14

获取最新版本的pandoc(1.12.2)。那你就可以

pandoc -f html+tex_math_dollars+tex_math_single_backslash -t latex
 类似资料:
  • 我想使用itext 2.1.7将一个html页面转换为pdf。我已经使用HTMLWorker来转换html文件,但它没有采用我在html中使用的内联css。下面是我的代码片段。谁能帮助解决这个问题… 提前道谢!

  • 问题内容: 我是一名PHP开发人员,在我的一个项目中,我需要将一些HTML文档(大约30至50页)转换为PDF文档。 我的搜索找到了以下可能的解决方案。其中包括一些PHP库和一些命令行应用程序。每种都有自己的优点和缺点。 PHP库: fpdf(需要更多的转换努力) tcpdf(需要更多的转换努力) html2fpdf http://html2fpdf.sourceforge.net html2pd

  • 正如在这里被问及的,这个#58538732的后续问题 根据Lukas Eder的建议,我编写了一个,将转换为 现在看起来如下所示 出现以下错误消息: 线程“main”java.lang中出现异常。错误:未解决的编译问题: 无法访问QueryFeaturesTask类型的封闭实例。必须使用QueryFeaturesTask类型的封闭实例限定分配(例如,x.new A(),其中x是QueryFeatu

  • 问题内容: 如何使用Python将PDF文件转换为HTML? 我只是在想Google会(或似乎会)对PDF文件建立索引的行为。 我的最终目标是设置Apache以显示PDF文件的HTML,因此,向该方向发展的任何事情也将不胜感激。 问题答案: 该poppler的包提供了一个实用PDF2HTML您可能能够使用。还有一个Python绑定到libpoppler。

  • 问题内容: 可以使用PHP将HTML页面转换为PDF吗?如果可以,该如何做? 具体而言,页面是动态生成的发票。所以我想使用以下命令加载它: 而且HTML输出必须转换为PDF。 任何好的库都可以。 问题答案: 如果您希望从php 创建 pdf,则pdflib将为您提供帮助(就像其他人建议的那样)。 否则,如果您想通过PHP 将 HTML页面 转换 为PDF,您将在这里发现一些麻烦。.3年以来,我一直

  • 我一直在尝试使用他们的库将html内容转换为docx,我确实在运行我的应用程序后创建了一个docx文件,但它有空白内容,而html中确实有一些内容。请检查下面的代码,我已经包含了git上AndroidDocxtoHTML示例中所有必要的库。 代码: 我不明白我得到的空白文档的代码中缺少了什么。我为java找到了这段代码,我为android修改了这段代码。有些人建议使用夜间构建jar进行xhtml转