当前位置: 首页 > 工具软件 > Apache Tika > 使用案例 >

【使用Apache Tika组件判断文件真实类型】

万俟承望
2023-12-01

目前博主已知的判断文件方法:

  1. 文件后缀名判断
  2. java.nio.file.Files.probeContentType()(应该也是判断后缀名)
  3. 通过文件头判断(见之前的拙见博客
  4. 使用 apache Tika组件判断
  • 显然想要判断文件的真实类型,至少要从检测文件数据的想法起步,所以我们可以采用自己编写工具类读取文件数据并判断文件的真实类型。
  • 然而文件类型数不胜数,自己去封装一个很好的工具类是一件不太容易的事情。因此我选择使用现成的开源组件:apache Tika(封装的很好了)

导入apache Tika

<dependency>
    <groupId>org.apache.tika</groupId>
    <artifactId>tika-core</artifactId>
    <version>2.4.0</version>
</dependency>

简单使用实例

/**
 * @author Yaxin
 * @date 2022/6/8 21:41
 */
public class FileUtil {
    static Tika tika = new Tika();
    static final String IMG = "image";

    public static String getMimeType(File file) {
        try {
            return tika.detect(file);
        } catch (IOException e) {
            e.printStackTrace();
        }
        return "Unidentifiable";
    }

    public static boolean isImg(File file) {
        return getMimeType(file).equals(IMG);
    }
}

PS

网上某些论坛一篇博文转来转去真是误人子弟

 类似资料: