- Python - 文本处理
- Python - 文本处理简介
- Python - 文本处理环境
- Python - 字符串不可变性
- Python - 排序行
- Python - 重新格式化段落
- Python - 计算段落中的标记
- Python - 二进制 ASCII 转换
- Python - 字符串作为文件
- Python - 向后读取文件
- Python - 筛选重复单词
- Python - 从文本中提取电子邮件
- Python - 从文本中提取 URL
- Python - 美观打印
- Python - 文本处理状态机
- Python - 大写开头和翻译
- Python - 符号化
- Python - 去除停用词
- Python - 同义词和反义词
- Python - 文本翻译
- Python - 单词替换
- Python - 拼写检查
- Python - WordNet 接口
- Python - 语料库访问
- Python - 给单词打标签
- Python - 块和缺口
- Python - 块分类
- Python - 文本分类
- Python - 二元语法
- Python - 处理 PDF
- Python - 处理 Word 文档
- Python - 读取 RSS 提要
- Python - 情感分析
- Python - 搜索和匹配
- Python - 文本润色
- Python - 文本包装
- Python - 频度分布
- Python - 文本摘要
- Python - 词干提取算法
- Python - 受限搜索
Python - 搜索和匹配
在使用正则表达式时,有两个经常混淆的基本操作,但它们的显著差异。re.match() 只检查字符串开头的匹配项,而 re.search() 检查字符串中任何位置的匹配项。这在文本处理中扮演了重要角色,因为我们常常必须编写正确的正则表达式,才能检索出情感分析的文本块,例如。
import re if re.search("tor", "Tutorial"): print "1. search result found anywhere in the string" if re.match("Tut", "Tutorial"): print "2. Match with beginning of string" if not re.match("tor", "Tutorial"): print "3. No match with match if not beginning" # Search as Match if not re.search("^tor", "Tutorial"): print "4. search as match"
当我们运行以上程序时,我们获得以下输出 −
1. search result found anywhere in the string 2. Match with beginning of string 3. No match with match if not beginning 4. search as match
广告