以下代码使用 Python 正则表达式在给定字符串中匹配给定的多个单词示例import re s = "These are roses and lilies and orchids, but not marigolds or .." r = re.compile(r'\broses\b | \bmarigolds\b | \borchids\b', flags=re.I | re.X) print r.findall(s)输出这将输出['roses', 'orchids', 'marigolds']
现在推荐使用 io 模块,并且它与 Python 3 的 open 语法兼容:以下代码用于在 Python 中读取和写入 Unicode(UTF-8) 文件示例import io with io.open(filename,'r',encoding='utf8') as f: text = f.read() # 处理 Unicode 文本 with io.open(filename,'w',encoding='utf8') as f: f.write(text)
以下代码在给定的文本文件中执行替换。替换后,文本将写入一个名为 'bar.txt' 的新文本文件示例f1 = open('foo.txt', 'r') f2 = open('bar.txt', 'w') for line in f1: print line f2.write(line.replace('Poetry', 'Prose')) f2 = open('bar.txt', 'r') for line in f2: print line, f1.close() f2.close()输出这将输出诗歌通常被认为是最古老的文学形式。今天的诗歌通常是写下来的,但有时仍然会表演。散文通常被认为是最古老的文学形式。今天的散文通常是写下来的,但有时仍然会表演。阅读更多