特殊字符和重音字符

法和硕

2023-03-14

问题内容：

我正在为法国客户做一些工作，因此需要处理带重音符号的字符。但是我遇到了很多困难，希望解决方案很简单，并且有人可以向我指出。

字符串：La Forêt pour Témoin 转换为：La For? pour T?oin

请注意，带重音符号的字符缺失- 在 ê* 后面紧跟着 t ，在 é 后面紧跟着 m 。 *

我尝试使用StringEscapeUtils来成功转义某些字符，例如 ă 。我还构建了自己的转义功能，该功能产生相同的结果（ ă 可以工作，
ê 不会）。

private String escapeChars(String string) {
    char[] chars = string.toCharArray();
    String result = "";
    for (int i = 0; i < chars.length; i++) {
        int c = chars[i];
        result += "&#" + c + ";";
    }
    return result;
}

该项目使用App Engine插件在eclipse中运行，我无法缩小问题范围是由Java，App Engine还是SQLite引起。

任何帮助表示赞赏。

编辑： 我发现仅从表单显示请求参数时，字符串格式错误。（即request.getParameter（“ string”）已包含格式错误的内容）。

我尝试了丹尼尔（Daniel）建议的元标记，但没有成功。我认为您处在正确的轨道上，html文档的标头数据如下：

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

当重音字符被硬编码到JSP中时，它们将按预期显示。

编辑： 我也已经添加<?xml version="1.0" encoding="UTF-8"?>到页面的开头。

我非常接近解决方案。我发现，如果我从浏览器中更改页面的编码，则表单数据会正确地传递到服务器。我不知道如何使浏览器自动检测页面编码。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

解决： 我不知道如何使浏览器自动检测Java默认使用的UTF-8编码。因此，我已使用request.setCharacterEncoding（“
ISO-8859-1”）将字符编码强制为ISO-8859-1。

问题答案：

编辑：我发现仅从表单显示请求参数时，字符串格式错误。（即request.getParameter（“ string”）已包含格式错误的内容）。

这可能有三个原因：

这是一个GET请求，服务器未配置为使用UTF-8解析请求URI。目前还不清楚你正在使用的服务器，所以这里的一个Tomcat针对性的答案例如：集URIEncoding的属性HTTP连接器中/conf/server.xml来UTF-8。
如果是POST请求，则需要确保servlet容器使用UTF-8编码请求主体。您可以request.setCharacterEncoding("UTF-8")事先做。
您正在向其中写入参数的控制台不支持UTF-8。目前尚不清楚您在谈论哪个控制台，因此这里以Eclipse为目标的答案为例：在“ _窗口” >“首选项”>“常规”>“工作区”>“文本文件编码”_中将其设置为UTF-8。

另请参阅 ：

Unicode-如何正确获取字符？-包含对各种问题的详细解答。

特殊字符和重音字符

相关阅读

相关文章

相关问答

相关工具

相关文档