废话不多说了,直接给大家贴代码了,具体代码如下所示:
#include "stdio.h" #include <sstream> #include <iostream> #include <fstream> #include <regex> using namespace std; void Trim(char * str); void lTrim(char * str); void rTrim(char * str); // 测试sscanf 和 正则表达式 // sscanf提供的这个扩展功能其实并不能真正称为正则表达式,因为他的书写还是离不开% // []表示字符范围,{}表示重复次数,^表示取非,*表示跳过。所以上面这个url的解析可以写成下面这个样子: // //char url[] = "dv://192.168.1.253:65001/1/1" // //sscanf(url, "%[^://]%*c%*c%*c%[^:]%*c%d%*c%d%*c%d", protocol, ip, port, chn, type); // //解释一下 //先取得一个最长的字符串,但不包括字串 ://,于是protocol="dv\0"; //然后跳过三个字符,(%*c)其实就是跳过 :// // 接着取一个字符串不包括字符串 : ,于是ip = 192.168.1.253,这里简化处理了,IP就当个字符串来弄,而且不做检查 // 然后跳过冒号取端口到port,再跳过 / 取通道号到chn,再跳过 / 取码流类型到type。 // c语言实现上例 void test1() { char url[] = "dv://192.168.1.253:65001/1/1"; char protocol[10]; char ip[17]; int port; int chn; int type; sscanf(url, "%[^://]%*c%*c%*c%[^:]%*c%d%*c%d%*c%d", protocol, ip, &port, &chn, &type); printf("%s, %s, %d, %d, %d\n", protocol, ip, port, chn, type); } // 读取ini里某行字符串, 得到: hello world! // 正常串1: -claim="hello world!" // 正常串2: claim = "hello world!" // 正常串3: claim = " hello world!" // 正常串4: claim_ = hello world! // 干扰串1: cl-aim = \"hello world!" // 干扰串2: clai3m = "hello world!\" // 干扰串3: cla_im = \\"hello world!\" // 干扰串4: claim ='"hello world!\" // 干扰串5: claim= @"\nhello world!" // 干扰串6: claim=L"hello world!" // 未处理1: claim[1] = 1 // 未处理1: claim[2] = 1 void test2() { char line[1000] = { 0 }; char val[1000] = { 0 }; char key[1000] = { 0 }; FILE *fp = fopen("1.txt", "r"); if (NULL == fp) { printf("failed to open 1.txt\n"); return ; } while (!feof(fp)) { memset(line, 0, sizeof(line)); fgets(line, sizeof(line) - 1, fp); // 包含了每行的\n printf("%s", line); Trim(line); // 提取等号之前的内容 memset(key, 0, sizeof(key)); // sscanf使用的format不是正则表达式,不能用 \\s 表示各种空白符,即空格或\t,\n,\r,\f sscanf(line, "%[^ \t\n\r\f=]", key); //sscanf(line, "%*[^a-zA-Z0-9_-]%[^ \t\n\r\f=]", key); printf(" key: [%s]\n", key); // 提取等号之后的内容 memset(val, 0, sizeof(val)); sscanf(line, "%*[^=]%*c%[^\n]", val); // 不包含了每行的换行符 Trim(val); printf(" val: [%s]\n", val); // 去除两边双引号 // ... // 插入map // map[key]=value; // string 转 其它类型 // atoi, atol, atof } printf("\n"); fclose(fp); } // 上例的C++实现 template<class T1, class T2> inline T1 parseTo(const T2 t) { static stringstream sstream; T1 r; sstream << t; sstream >> r; sstream.clear(); return r; } void test3() { char val[1000] = { 0 }; char key[1000] = { 0 }; ifstream fin("1.txt"); string line; if (fin) { while (getline(fin, line)) // line中不包括每行的换行符 { cout << line << endl; /// 提取等号之前的内容 // 第1组()表示任意个空格字符,第2组()表示单词(可带_或-), // 第3组()表示1个以上的空格字符(或=),最后以任意字符串结尾 regex reg("^([\\s]*)([\\w\\-\\_]+)([\\s=]+).*$"); // 取第2组代替原串 string key = regex_replace(line, reg, "$2"); cout << " key: {" << key << "}" << endl; /// 提取等号之后的内容 // 第1组()表示任意个空格字符,第2组()表示单词(可带_或-), // 第3组()表示1个以上的空格字符(或=),第4组()表示任意个字符, // 第5组()表示以任意个空格字符(或回车换行符)结尾。 reg = regex("^([\\s]*)([\\w\\-\\_]+)([\\s=]+)(.*)([\\s\\r\\n]*)$"); // 取第4组代替原串 string val = regex_replace(line, reg, "$4"); cout << " val: {" << val << "}" << endl; // 去除两边双引号 // ... // 插入map // map[key]=value; // string 转 其它类型 // int i = parseTo<int>("123"); // float f = parseTo<float>("1.23"); // string str = parseTo<string>(123); } } else // 没有该文件 { cout << "no such file" << endl; } } void main() { //test1(); test2(); test3(); } void lTrim(char * str) { int i, len; len = strlen(str); for (i = 0; i<len; i++) { if (str[i] != ' ' && str[i] != '\t' && str[i] != '\n' && str[i] != '\r' && str[i] != '\f') break; } memmove(str, str + i, len - i + 1); return; } void rTrim(char * str) { int i, len; len = strlen(str); for (i = len - 1; i >= 0; i--) { if ((str[i] != ' ') && (str[i] != 0x0a) && (str[i] != 0x0d) && (str[i] != '\t') && (str[i] != '\f')) break; } str[i + 1] = 0; return; } void Trim(char * str) { int i, len; //先去除左边的空格 len = strlen(str); for (i = 0; i<len; i++) { if (str[i] != ' ' && str[i] != '\t' && str[i] != '\n' && str[i] != '\r' && str[i] != '\f') break; } memmove(str, str + i, len - i + 1); //再去除右边的空格 len = strlen(str); for (i = len - 1; i >= 0; i--) { if (str[i] != ' ' && str[i] != '\t' && str[i] != '\n' && str[i] != '\r' && str[i] != '\f') break; } str[i + 1] = 0; return; } /* void Trim(char * str) { lTrim(str); rTrim(str); } */
以上所述是小编给大家介绍的使用正则表达式(regex_replace)模拟读取INI文件,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对小牛知识库网站的支持!
行动时刻 - 使用正则表达式 Unlang允许在条件检查中进行正则表达式计算。这些通常是Posix正则表达式。运算符=〜和!〜与正则表达式相关联。为了简单的概念证明,我们将修改上一个练习: 1.编辑FreeRADIUS配置目录下的sites-available / default虚拟服务器,并在该部分顶部的post-auth部分中添加以下内容: if(request:Framed-Protocol
问题内容: 我需要这件事的帮助。查看以下正则表达式: 我想查找这样的词:“自制”,“ aaaa-bbb”而不是“ aaa-bbb”,而 不是 “ aaa–aa–aaa”。基本上,我想要以下内容: 单词-连字符-单词。 它适用于所有内容,但该模式会通过:“ aaa–aaa–aaa”,但不应通过。哪种正则表达式适用于此模式? 问题答案: 可以从表达式中删除反斜杠: 下面的代码应该工作 请注意,您可以使
我需要编写一个具有以下规则的正则表达式: null null 这些示例无效: > 12--11(因为它包含两个连字符) 1-2345(因为它包含5号) <>是字符出现在最后一个位置,那么在字符之前必须有一个数字not hypen。 即11-A(必须不及格)11-1A(必须及格)
我是正则表达式的初学者,并尝试搜索特定的数字模式。以下数据以 XML 格式嵌入。 要求是提取数据(最里面的列表)。在这个例子中,数据从24779开始到24760。注意:每次数据可能不是从“24”开始。因此,我计划通过以下逻辑提取:如果标签名(在本例中:DUT_1_PC)具有非零的有效数据,并且有效数据的计数大于100,用逗号分隔,则提取该列表及其标签名(DUT_1_PC)。 我无法提取所需的数据。
为什么要学正则表达式 实际上爬虫一共就四个主要步骤: 明确目标 (要知道你准备在哪个范围或者网站去搜索) 爬 (将所有的网站的内容全部爬下来) 取 (去掉对我们没用处的数据) 处理数据(按照我们想要的方式存储和使用) 我们在昨天的案例里实际上省略了第3步,也就是”取”的步骤。因为我们down下了的数据是全部的网页,这些数据很庞大并且很混乱,大部分的东西使我们不关心的,因此我们需要将之按我们的需要过
sorter: "${$(...props)=>{timeSort(createTime)}$}$", ..$}$"."${$.. 希望结果 :sorter: (...props)=>{timeSort(createTime)}, ..$}$"."${$.. 规则: "${$ 和 $}$" 是一对,将他们替换为空。