我需要在网络驱动器上遍历一个目录,并在层次结构中创建子级到父级的映射。一个代表目录是6个Terrabytes,有90万个文件和900个文件夹。我只关心文件夹而不是文件。出于测试目的,我将没有文件的文件夹复制到另一个网络驱动器,并在复制的版本上运行代码。仅仅是在900个文件夹上迭代可能需要10秒。但是,迭代原始目录结构需要30分钟。我们似乎正在遍历所有90万个文件,尽管我们只是忽略它们。
有没有一种方法可以通过不看文件来加快速度呢?如果可以的话,我更愿意坚持使用纯Java。通过Windows资源管理器浏览这个庞大的目录时,一点也不觉得慢。我的代码在下面。
public static Map<String, String> findFolderPaths(File parentFolder) throws IOException {
Map<String, String> parentFolderMap = new HashMap<String, String>();
Files.walkFileTree(parentFolder.toPath(), new FolderMappingFileVisitor(parentFolderMap));
return parentFolderMap;
}
static class FolderMappingFileVisitor extends SimpleFileVisitor<Path> {
private Map<String, String> mapping;
FolderMappingFileVisitor(Map<String, String> map) {
this.mapping = map;
}
@Override
public FileVisitResult preVisitDirectory(Path dir,
BasicFileAttributes attrs) throws IOException {
File directory = dir.toFile();
mapping.put(directory.getName(), directory.getParent());
return FileVisitResult.CONTINUE;
}
}
编辑:
我没有提到的一个重要的谜题是我们正在WebStart中运行这个应用程序。我报道的时代来自生产,而不是发展。从Eclipse运行,时间更符合我对FileWalker的期望。
您使用的方法是获取BasicFileAttributes,我怀疑它是访问每个文件的文件描述信息。
如果您所需要的只是名称,那么我建议您重复/递归地调用file.listfiles();而这只应获得您所要求的信息。
类似于
public static Map<String, String> findFolderPaths(File parentFolder) throws IOException {
Map<String, String> map = new HashMap<String, String>();
findFolderPaths(parentFolder, map);
return map;
}
public static void findFolderPaths(File dir, Map<String, String> map) throws IOException {
map.put(dir.getName(), dir.getPparent());
for(File file : dir.listFiles())
if (file.isDirectory())
findFolderPaths(file, map);
}
问题内容: 我有一个目录日志文件。我想使用Python脚本处理此目录中的每个文件。 我该怎么做呢? 问题答案: 使用或,取决于您是否要递归执行。
本文向大家介绍PHP遍历目录并返回统计目录大小,包括了PHP遍历目录并返回统计目录大小的使用技巧和注意事项,需要的朋友参考一下
X1.4.0新增 sp_scan_dir($pattern,$flags) 功能: 替代scan_dir的方法 参数: $pattern:检索模式 搜索模式 .txt,.doc; (同glog方法) $flags:返回模式 同glog方法 返回: 类型数组 使用方法: //扫描application目录 $files=sp_scan_dir('application/*');//返回applic
本文向大家介绍python遍历文件夹,指定遍历深度与忽略目录的方法,包括了python遍历文件夹,指定遍历深度与忽略目录的方法的使用技巧和注意事项,需要的朋友参考一下 背景 需要在文件夹中搜索某一文件,找到后返回此文件所在目录。用最常规的os.listdir()方式实现了一版,但执行时报错:递归超过最大深度。于是自己添加了点功能,之所有写此函数是为了让它适应不同的项目,因为有项目要找的文件在第一层
问题内容: 我需要创建一个遍历子目录中所有文件的循环。您能帮我构造我的代码吗? 问题答案: 将RecursiveDirectoryIterator与RecursiveIteratorIterator结合使用。
问题内容: 我需要获取目录中所有文件的列表,包括所有子目录中的文件。用Java完成目录迭代的标准方法是什么? 问题答案: 你可以用来测试给定的文件(路径)是否为目录。如果是true,则只需再次调用同一个方法及其结果即可。这称为递归。 这是一个基本的启动示例。 请注意,这对树的深度超过JVM堆栈可以容纳的深度很敏感。你可能要使用迭代方法或尾递归,但这是另一个主题;)