Apache POI Word - 概述



很多时候,软件应用程序需要生成Microsoft Word文件格式的参考文档。有时,甚至期望应用程序接收Word文件作为输入数据。

任何想要生成MS-Office文件作为输出的Java程序员都必须使用预定义的只读API来做到这一点。

什么是Apache POI?

Apache POI是一个流行的API,允许程序员使用Java程序创建、修改和显示MS-Office文件。它是一个由Apache软件基金会开发和分发的开源库,用于使用Java程序设计或修改MS-Office文件。它包含用于将用户输入数据或文件解码为MS-Office文档的类和方法。

Apache POI的组件

Apache POI包含用于处理所有MS-Office的OLE2复合文档的类和方法。此API的组件列表如下:

  • POIFS (Poor Obfuscation Implementation File System) − 此组件是所有其他POI元素的基本因素。它用于显式读取不同的文件。

  • HSSF (Horrible SpreadSheet Format) − 用于读取和写入MS-Excel文件的.xls格式。

  • XSSF (XML SpreadSheet Format) − 用于MS-Excel的.xlsx文件格式。

  • HPSF (Horrible Property Set Format) − 用于提取MS-Office文件的属性集。

  • HWPF (Horrible Word Processor Format) − 用于读取和写入MS-Word的.doc扩展名文件。

  • XWPF (XML Word Processor Format) − 用于读取和写入MS-Word的.docx扩展名文件。

  • HSLF (Horrible Slide Layout Format) − 用于读取、创建和编辑PowerPoint演示文稿。

  • HDGF (Horrible DiaGram Format) − 包含用于MS-Visio二进制文件的类和方法。

  • HPBF (Horrible PuBlisher Format) − 用于读取和写入MS-Publisher文件。

本教程将指导您完成使用Java处理MS-Word文件的过程。因此,讨论仅限于HWPF和XWPF组件。

注意 − POI的早期版本支持二进制文件格式,例如DOC、XLS、PPT等。3.5版及更高版本,POI支持MS-Office的OOXML文件格式,例如DOCX、XLSX、PPTX等。

广告