- Python - 文本处理
- Python - 文本处理简介
- Python - 文本处理环境
- Python - 字符串不可变性
- Python - 排序行
- Python - 重新格式化段落
- Python - 统计段落中标记的个数
- Python - 二进制 ASCII 转换
- Python - 字符串作为文件
- Python - 反向文件读取
- Python - 过滤重复的单词
- Python - 从文本中提取电子邮件
- Python - 从文本中提取 URL
- Python - 漂亮打印
- Python - 文本处理状态机
- Python - 大写化和翻译
- Python - 标记化
- Python - 去停用词
- Python - 同义词和反义词
- Python - 文本翻译
- Python - 词语替换
- Python - 拼写检查
- Python - WordNet 接口
- Python - 语料库访问
- Python - 词性标注
- Python - 块和块隙
- Python - 块分类
- Python - 文本分类
- Python - 二元词
- Python - 处理 PDF
- Python - 处理 Word 文档
- Python - 读取 RSS 订阅
- Python - 情感分析
- Python - 搜索并匹配
- Python - 文本修整
- Python - 文本换行
- Python - 频率分布
- Python - 文本摘要
- Python - 词干算法
- Python - 约束搜索
Python - 从文本中提取电子邮件
要从文本中提取电子邮件,我们可以正则表达式的帮助。在下面的示例中,我们借助正则表达式包来定义电子邮件 ID 的模式,然后使用 findall() 函数来检索与该模式匹配的文本。
import re text = "Please contact us at [email protected] for further information."+\ " You can also give feedbacl at [email protected]" emails = re.findall(r"[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+", text) print emails
当我们运行以上程序时,我们将获得以下输出 −
['[email protected]', '[email protected]']
广告