以下使用 Python 正则表达式的代码在给定字符串中匹配给定的多个单词示例import re s = "These are roses and lilies and orchids, but not marigolds or .." r = re.compile(r'\broses\b | \bmarigolds\b | \borchids\b', flags=re.I | re.X) print r.findall(s)输出这将给出输出['roses', 'orchids', 'marigolds']
现在建议使用 io 模块,并且它与 Python 3 的 open 语法兼容:以下代码用于在 Python 中读取和写入 unicode(UTF-8) 文件示例import io with io.open(filename,'r',encoding='utf8') as f: text = f.read() # 处理 Unicode 文本 with io.open(filename,'w',encoding='utf8') as f: f.write(text)