要从文本中提取电子邮件,我们可以采用正则表达式。 在下面的示例中,我们借助正则表达式包来定义电子邮件ID的模式,然后使用findall()函数来检索与此模式匹配的文本。
import re
text = "Please contact us at contact@xnip.cn for further information."+\
" You can also give feedbacl at feedback@tp.com"
emails = re.findall(r"[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+", text)
print emails
当我们运行上面的程序时,我们得到以下输出 -
['contact@xnip.cn', 'feedback@tp.com']