Python - 使用 .docx 模块
Word 文档包含格式化的文本,包裹在三个对象级别中。最低级别- 运行对象、中间级别- 段落对象和最高级别- 文档对象。
因此,我们不能使用普通文本编辑器处理这些文档。但是,我们可以使用 python-docx 模块在 Python 中操纵这些 Word 文档。
- 第一步是安装这个第三方模块 python-docx。你可以使用 pip “pip install python-docx”
- 安装后导入“docx”,而不是“python-docx”。
- 使用“docx.Document”类开始处理 Word 文档。
示例
# import docx NOT python-docx import docx # create an instance of a word document doc = docx.Document() # add a heading of level 0 (largest heading) doc.add_heading('Heading for the document', 0) # add a paragraph and store # the object in a variable doc_para = doc.add_paragraph('Your paragraph goes here, ') # add a run i.e, style like # bold, italic, underline, etc. doc_para.add_run('hey there, bold here').bold = True doc_para.add_run(', and ') doc_para.add_run('these words are italic').italic = True # add a page break to start a new page doc.add_page_break() # add a heading of level 2 doc.add_heading('Heading level 2', 2) # pictures can also be added to our word document # width is optional doc.add_picture('path_to_picture') # now save the document to a location doc.save('path_to_document')
广告