当前位置: 首页 > 工具软件 > UTF-8 CPP > 使用案例 >

C++ 读写utf-8文件

司空俊悟
2023-12-01

UTF-8

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到4个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。

C++编码时有时会用到修改utf-8文件,c++11新特性里给了新的解决办法。

包含头文件 #include <codecvt>

#include <fstream>
#include <string>
#include <codecvt>
#include <iostream>

using namespace std;

int main(int argc, char *argv[])
{
	std::wstring str = L"123,abc:我是谁!";

	std::wstring_convert<std::codecvt_utf8<wchar_t>> conv;

	std::string narrowStr = conv.to_bytes(str);
	{
		std::ofstream ofs("d:\\test.txt");			//文件是utf8编码
		ofs << narrowStr;
	}

	std::ifstream ifs(L"d:\\test.txt");				
	while (!ifs.eof())
	{
		string line;
		getline(ifs, line);
		wstring wb = conv.from_bytes(line);
		wcout.imbue(locale("chs"));			//更改区域设置 只为控制台输出显示
		wcout << wb << endl;
	}
}


 类似资料: