本教程提供了对Apache Tika库的基本了解,它支持的文件格式,以及使用Apache Tika的内容和元数据提取。
本教程适用于所有希望使用Apache Tika学习文档类型检测和内容提取的Java爱好者。
为了充分利用本教程,读者应该事先接触Java编程,使用Java中的JDK 1.6和IO概念。