- Python - 文本处理
- Python - 文本处理简介
- Python - 文本处理环境
- Python - 字符串不变性
- Python - 排序行
- Python - 段落重新格式化
- Python - 统计段落中的词元
- Python - 二进制ASCII转换
- Python - 字符串作为文件
- Python - 反向读取文件
- Python - 过滤重复单词
- Python - 从文本中提取电子邮件
- Python - 从文本中提取URL
- Python - 美化打印
- Python - 文本处理状态机
- Python - 首字母大写和翻译
- Python - 分词
- Python - 删除停用词
- Python - 同义词和反义词
- Python - 文本翻译
- Python - 单词替换
- Python - 拼写检查
- Python - WordNet接口
- Python - 语料库访问
- Python - 词性标注
- Python - 块和块间隙
- Python - 块分类
- Python - 文本分类
- Python - 二元语法
- Python - 处理PDF
- Python - 处理Word文档
- Python - 读取RSS feed
- Python - 情感分析
- Python - 搜索和匹配
- Python - 文本清洗
- Python - 文本换行
- Python - 频率分布
- Python - 文本摘要
- Python - 词干提取算法
- Python - 受约束的搜索
Python - 拼写检查
拼写检查是任何文本处理或分析的基本要求。Python包pyspellchecker 提供了这项功能,可以查找可能拼写错误的单词,并建议可能的更正。
首先,我们需要在Python环境中使用以下命令安装所需的包。
pip install pyspellchecker
现在我们看看如何使用该包来指出拼写错误的单词,并对可能的正确单词提出一些建议。
from spellchecker import SpellChecker spell = SpellChecker() # find those words that may be misspelled misspelled = spell.unknown(['let', 'us', 'wlak','on','the','groun']) for word in misspelled: # Get the one `most likely` answer print(spell.correction(word)) # Get a list of `likely` options print(spell.candidates(word))
运行上述程序后,我们将得到以下输出:
group {'group', 'ground', 'groan', 'grout', 'grown', 'groin'} walk {'flak', 'weak', 'walk'}
区分大小写
如果我们使用Let代替let,这将成为与字典中最接近匹配的单词的大小写敏感比较,结果现在看起来不同了。
from spellchecker import SpellChecker spell = SpellChecker() # find those words that may be misspelled misspelled = spell.unknown(['Let', 'us', 'wlak','on','the','groun']) for word in misspelled: # Get the one `most likely` answer print(spell.correction(word)) # Get a list of `likely` options print(spell.candidates(word))
运行上述程序后,我们将得到以下输出:
group {'groin', 'ground', 'groan', 'group', 'grown', 'grout'} walk {'walk', 'flak', 'weak'} get {'aet', 'ret', 'get', 'cet', 'bet', 'vet', 'pet', 'wet', 'let', 'yet', 'det', 'het', 'set', 'et', 'jet', 'tet', 'met', 'fet', 'net'}
广告