1. __init__ 初始化文件路径,关键字1,关键字2;
2. key_match 使用with open 方法,以二进制方式(也可以改成utf-8,GB2312)读取文件内容(支持txt/log格式);
3. buffer = f.read() 一致性读取到buffer中,读取超大文件会发生MemoryError(可以设置每次读取的size或切割文件)。
#!/usr/bin/python3 # -*- coding: utf-8 -*- import re #文本所在路径,引号前加r指按路径处理 #关键字word1,word2,换关键字,需修改引号间的内容 class match2Words(object): lines=0 def __init__(self,path,word1,word2): self.path = path self.word1 = word1 self.word2 = word2 def key_match(self): with open(self.path,'rb') as f: buffer = f.read() pattern = re.compile(self.word1+b'(.*?)'+self.word2,re.S) result = pattern.findall(buffer) if result != []: print(result) #self.lines +=1 #print("匹配到的行数:",self.lines) else: print("没有找到你输入的关键字") path = input("请输入要分析的log地址:") word1 = b"begin" word2 = b"end" matchWords = match2Words(path, word1, word2) matchWords.key_match()
以上这篇python截取两个单词之间的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。
本文向大家介绍python提取内容关键词的方法,包括了python提取内容关键词的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了python提取内容关键词的方法。分享给大家供大家参考。具体分析如下: 一个非常高效的提取内容关键词的python代码,这段代码只能用于英文文章内容,中文因为要分词,这段代码就无能为力了,不过要加上分词功能,效果和英文是一样的。 希望本文所述对大家的Pyth
问题内容: 什么是获取两个字符串之间内容的最佳方法,例如 由于某种原因,这似乎在我的代码中的一个地方起作用,而不是另一个地方。我会以正确的方式解决这个问题吗?或者,还有更好的方法? 输出缓冲区也是这样做的方法还是file_get_contents? 提前致谢! 问题答案: 使用代替,这样您就不必逃避它们。 该修改 品牌和还包括换行。 并具有各种功能,例如的n到m倍。 基础的 各种标签等的高级(Ja
本文向大家介绍c#获取两个特定字符之间的内容并输出的方法,包括了c#获取两个特定字符之间的内容并输出的方法的使用技巧和注意事项,需要的朋友参考一下 今天一直在绞尽脑汁的寻找解决两个字符之间的内容如何输出的问题,刚开始就使用了万能的正则表达式;但是不知哪里的原因 自己的数据一直出不来,觉得应该是我输入的字符的问题吧,因为我获取的是一个inp文件里的内容(类似与文本文件); 虽然这次正则表达的强大没有
问题内容: 我有几个s,并且想要将它们中的每一个转换成单个,其中原始元素的每个元素都由空格“”分隔。天真的第一方法就是这样做 谁能想到更快,更漂亮或更有效的方式来做到这一点? 问题答案: 使用commons / lang可以使用 StringUtils.join 来做到这一点: 为了简洁起见,您无法真正击败它。 更新: 重新阅读此答案,我现在希望使用有关番石榴木匠的其他答案。实际上,这些天我不接近
本文向大家介绍php按单词截取字符串的方法,包括了php按单词截取字符串的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了php按单词截取字符串的方法。分享给大家供大家参考。具体分析如下: 这里指定字符串和单词数量进行截取 希望本文所述对大家的php程序设计有所帮助。
问题内容: 我有一个嘈杂的数据。 现在我只想提取。有没有办法删除这两个定界符和之间的文本? 问题答案: 使用正则表达式: [更新] 如果您尝试过类似的模式,其中的点表示任何字符,而加号表示一个或多个,则您知道它不起作用。 为什么!?!这是因为正则表达式默认情况下是“贪婪的”。该表达式将匹配字符串之前的所有内容,包括-,这不是我们想要的。我们要匹配并在下一个处停止,因此我们使用的模式表示“除x外的任