当前位置: 首页 > 知识库问答 >
问题:

从word文档复制到网页时,文本会发生变化

后凯捷
2023-03-14

我正在创建一个博客引擎,其中包括一个

然后我使用ajax并将其存储到GAE数据存储提供的Text变量中

问题是:如果用户从word文档中复制文本,当嵌入到网页上时,我会在屏幕上看到各种随机字符。我知道这是因为word文件使用XML编码,HTML页面使用utf-8编码(在我的例子中)

问题:如何更改输入文本的编码?或者如何避免XML编码?或者改变我的网页编码是否有助于解决这个问题?

需要注意的要点:我想让它自动化。。我在谷歌上读到,你应该先把文本复制到一些简单的文本编辑器中,这些编辑器对编码进行格式化,然后将其复制到网页上。但这个选择对我来说不可行。

我以前也用过weebly,那次我从word文件中复制了文本,如果有人知道weebly是如何处理编码冲突的!

答案应为java:)


共有2个答案

范京
2023-03-14

不确定这是否对任何人都有帮助,但我花了几天时间试图解决这个问题。我的用例非常相似,只是我发现我的问题与剪贴板复制的方式有关(根据操作系统的不同,这种方式略有变化),然后粘贴文本。(我用ClipSpy调查“引擎盖下”发生了什么。)

请原谅我的外行的解释:剪贴板以多种格式存储文本,当发出粘贴命令时,它会尝试匹配收件人程序的字符集/编码,或者在我的例子中是

  • “剪切粘贴”是如何影响字符编码的?会出现什么问题

最终我所要做的就是尽早声明

国阳
2023-03-14

这是因为单词文档(逗号)在UTF-8标准中没有涵盖,所以您需要以编程方式处理它。

下面是一些关于javascript的例子

<textarea rows="4" onkeyup="replaceWordChars(this.value)" cols="50">
//your text area
</textarea> 


function replaceWordChars(text) {
    var s = text;
    // smart single quotes and apostrophe
    s = s.replace(/[\u2018|\u2019|\u201A]/g, "\'");
    // smart double quotes
    s = s.replace(/[\u201C|\u201D|\u201E]/g, "\"");
    // ellipsis
    s = s.replace(/\u2026/g, "...");
    // dashes
    s = s.replace(/[\u2013|\u2014]/g, "-");
    // circumflex
    s = s.replace(/\u02C6/g, "^");
    // open angle bracket
    s = s.replace(/\u2039/g, "<");
    // close angle bracket
    s = s.replace(/\u203A/g, ">");
    // spaces
    s = s.replace(/[\u02DC|\u00A0]/g, " ");
    document.getElementById("your Textarea ID ").value = s;
}

在文本区域,您需要启动此javascript函数onKeyup事件

 类似资料:
  • 我有一个wordpress页面,在JS中有一些自定义功能,人们可以用pdf格式保存。是否有一种方法可以让人们也下载docx(MS Word)中的页面?我试着寻找解决办法,但找不到太多。 我想有一个按钮‘下载为docx',生成一个类似的pdf格式的外观版本。

  • 我已经很多年没有使用VB了,所以如果这是显而易见的,请原谅我。我正在尝试编写一个word vba宏,以便在模板中使用,该模板将显示一个userform,然后导入fileA的内容。docx,fileB。docx或fileC。docx取决于用户表单。(之后我将使用书签填写一些表单数据,我不知道这是否相关)。文件A、B和C将包含一些基本格式(如列表)的文本,但没有什么特别之处。 我在网上看到的解决方案可

  • 我有一个Pdf,它的字体存储在 /Resources字典中,在文档的 /Pages级别,以便它们在每一页都可以重复使用。这似乎实现了两件事情:当然正确的显示,但也较小的文件大小。当使用iText从这个Pdf复制页面时,我注意到,无论使用更高级别或更低级别的函数(如PdfPage的复制到或复制到AsXObject),所得到的Pdf都没有这个特性——资源而是存储在每个单独的页面上。 在进行页面复制时,

  • 我有一个从Excel生成文档的代码。一方面,我有一个需要填充标记的文档,以生成与Excel中的行一样多的文档。另一方面,我有一个Excel,它在一行中有这个标记,并在Excel的每一行中填写Word文档中要填写的信息。 代码在只有文本和标签的普通文档中工作正常,但是当文档包含填充有文本的表时,它就不工作了... 这些是Excel和文档的一些图像... 带标签的Excel 普通文件 带表格的文件 这

  • 我使用自动化对Word文档进行了大量更改,然后运行了一个VBA宏,其中包括检查文档是否超过一定的页数。 我使用获取页数,但此方法返回的结果不正确。我想这是因为Word还没有更新文档的分页以反映我所做的更改。 也存在同样的问题。