当前位置: 首页 > 工具软件 > QCAD > 使用案例 >

QCAD 中文编码问题

鄢晔
2023-12-01

dxf文件为文本文件,中文编码可能是utf-8编码,也有可能是GBK编码。QCAD使用Qt开发环境,字符串统一按照utf-8编码解码,
所以解析dxf文件时对字符串首先按照utf-8转码,如果转码失败则按照GBK转码。

QString decode(const std::string& str) {
    //GBK UTF-8->Unicode
    QByteArray data=QByteArray::fromStdString(str);
    QTextCodec::ConverterState state;
    QTextCodec *codec = QTextCodec::codecForName("UTF-8");
    QString str_tmp=codec->toUnicode(data.constData(),data.size(),&state);
    if(state.invalidChars>0){
        str_tmp=QTextCodec::codecForName("GBK")->toUnicode(data);
    }else{
        str_tmp=data;
    }
    return RDxfServices::parseUnicode(str_tmp);
}

使用QString类进行编码转换

QString 类包含了大量关于文本字符串编码转换的函数,涉及之前提到的 UTF-8(变长)、UTF-16、UTF-32、本地语言编码 Local8Bit(多字节编码),
还有标准 C++ 的普通字符串 StdString 和宽字符串 StdWString,
对于其他编码转为 QString,采用的是 QString::from* 静态公有成员函数,
这些静态函数返回一个转换好的 QString 对象以供使用。
与之对应的是 QString 类对象的 to* 函数,
QString 对象可以调用这些 to* 函数转出为其他编码格式的字符串。
fromtodesc
fromLocal8BittoLocal8Bit与操作系统及本地化语言相关,Linux 一般是 UTF-8 字符串,Windows 一般是 ANSI 多字节编码字符串。
fromUtf8toUtf8与 UTF-8 编码的字符串相互转换。
fromUtf16utf16 和unicode与 UTF-16(UCS2)编码的字符串互相转换,utf16 函数与 unicode 函数功能一样, 注意没有 to 前缀,因为 QString 运行时的内码就是 UTF-16,字符的双字节采用主机字节序。
fromUcs4toUcs4与 UTF-32(UCS4)编码的字符串互相转换,一个字符用四个字节编码,占空间多,应用较少。
fromStdStringtoStdString与 std::string 对象互相转换,因为 C++11 规定标准字符串 std::string 使用 UTF-8 编码,这对函数功能与上面 **Utf8 转码函数相同。
fromStdWStringtoStdWString与 std::wstring 对象相互转换,在 Linux 系统里宽字符是四字节的 UTF-32,在 Windows 系统里宽字符是两字节的 UTF-16。因为不同平台有歧义,不建议使用。
 类似资料: