概述
很多时候,需要一个软件应用程序来生成Microsoft Word文件格式的参考文档。 有时,甚至希望应用程序接收Word文件作为输入数据。
任何想要生成MS-Office文件作为输出的Java程序员都必须使用预定义的只读API来执行此操作。
什么是Apache POI?
Apache POI是一种流行的API,允许程序员使用Java程序创建,修改和显示MS-Office文件。 它是由Apache Software Foundation开发和分发的开源库,用于使用Java程序设计或修改MS-Office文件。 它包含将用户输入数据或文件解码为MS-Office文档的类和方法。
Apache POI的组件
Apache POI包含用于处理MS-Office的所有OLE2复合文档的类和方法。 该API的组件列表如下 -
POIFS (Poor Obfuscation Implementation File System) - 该组件是所有其他POI元素的基本因素。 它用于显式读取不同的文件。
HSSF (Horrible SpreadSheet Format) - 用于读取和写入.xls格式的MS-Excel文件。
XSSF (XML SpreadSheet Format) - 用于MS-Excel的.xlsx文件格式。
HPSF (Horrible Property Set Format) - 用于提取MS-Office文件的属性集。
HWPF (Horrible Word Processor Format) - 用于读取和写入MS-Word的.doc扩展文件。
XWPF (XML Word Processor Format) - 用于读写MS-Word的.docx扩展文件。
HSLF (Horrible Slide Layout Format) - 用于阅读,创建和编辑PowerPoint演示文稿。
HDGF (Horrible DiaGram Format) - 它包含MS-Visio二进制文件的类和方法。
HPBF (Horrible PuBlisher Format) - 用于读写MS-Publisher文件。
本教程将指导您完成使用Java处理MS-Word文件的过程。 因此,讨论仅限于HWPF和XWPF组件。
Note - POI支持二进制文件格式的旧版本,如DOC,XLS,PPT等。 版本3.5 ONWARDS,POI支持MS-OFFICE的OOXML文件格式,如DOCX,XLSX,PPTX等。