使用正则表达式在 Python 中提取电子邮件地址


电子邮件地址非常复杂,世界各地没有遵循标准,这给在正则表达式中识别电子邮件带来了困难。RFC 5322 规范了电子邮件地址的格式。我们将使用此格式从文本中提取电子邮件地址。

例如,对于给定的输入字符串 −

Hi my name is John and email address is john.doe@somecompany.co.uk and my friend's email is jane_doe124@gmail.com

我们应该得到输出 −

john.doe@somecompany.co.uk
jane_doe124@gmail.com

我们可以使用以下正则表达式进行提取 −

[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+

我们可以使用 re 模块的 find all 方法来提取电子邮件地址。例如,

示例

import re

my_str = "Hi my name is John and email address is john.doe@somecompany.co.uk and my friend's email is jane_doe124@gmail.com"
emails = re.findall("([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)", my_str)

for mail in an email:
print(mail)

输出

将给出输出 −

john.doe@somecompany.co.uk
jane_doe124@gmail.com

更新于: 20-Jun-2020

5K+ 浏览

开始 职业生涯

完成该课程,获得认证

开始
广告
© . All rights reserved.