当前位置: 首页 > 面试题库 >

如何获取目录URL的文件/目录列表?

富勇军
2023-03-14
问题内容

假设我有一个URL:http://java.sun.com/j2se/1.5/pdf我想获得目录下所有文件/目录的列表pdf

我正在使用Java 5。

我可以使用此程序http://www.httrack.com/获得dir的列表,但是使用Java我不知道是否可行。

有谁知道如何用Java获得它?或者,如果Java无法执行,该程序将如何完成工作?


问题答案:

有一些条件:

  1. 服务器必须已启用目录列表,以便您查看其内容。
  2. 我没有办法(没有API或HTTP动词)来检索列表,因此该列表通常显示为普通HTML页面
  3. 您将必须解析此HTML页面才能找到条目。

使用JSoup这样的库可以轻松完成解析。

例如,使用JSoup,您可以http://howto.unixdev.net/像这样在url处获取文档:

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class Sample {
    public static void main(String[] args) throws IOException {
        Document doc = Jsoup.connect("http://howto.unixdev.net").get();
        for (Element file : doc.select("td.right td a")) {
            System.out.println(file.attr("href"));
        }
    }
}

将输出:

beignets.html
beignets.pdf
bsd-pam-ldap.html
ddns-updates.html
Debian_on_HP_dv6z.html
dextop-slackware.html
dirlist.html
downloads/
ldif/
Linux-SharePoint.html
rhfc3-apt.html
rhfc3-apt.tar.bz2
SUNWdsee-Debian.html
SUNWdtdte-b69.html
SUNWdtdte-b69.tar.bz2
tcshrc.html
Test_LVM_Trim_Ext4.html
Tru64-CS20-HOWTO.html

至于您的示例网址,http://java.sun.com/j2se/1.5/pdf这是找不到页面,所以我认为您很不走运。



 类似资料:
  • 问题内容: 因此,我试图使用文件handle.list()方法获取目录中的文件列表,但是即使目录中有文件,它也会返回一个空列表。在我看来,奇怪的是它可以在设备上运行,但不能在桌面上运行。我想我知道问题出在哪里,但是我却不知道如何解决。在方法描述中,它说“在桌面上,类路径上目录的FileType.Internal句柄将返回长度为零的数组。”,但是除此之外没有其他方法,所以你们认为我能做什么? 问题答

  • 问题内容: 只是一个简单的问题,如何获得指定目录内的目录列表。 例如, 现在,我需要获取“路径”目录中的目录列表。 谢谢! 问题答案: 诸如此类(添加null检查,异常等。)

  • 问题内容: 如何使用PHP获取目录内的文件名? 我找不到使用Google的相关命令,所以希望这个问题能对那些类似的问题有所帮助。 问题答案: 有很多方法。较旧的方法是但 可能是最好的方法。 还有(与一起使用)和。 以下是一些有关如何使用每个示例打印当前目录中所有文件的示例: 用法:(推荐) 用法: 和用法: 用法: 如评论中所述,这是很好的,因为我在那里使用的星号实际上可以用于对文件进行匹配,因此

  • 问题内容: 使用此代码 返回特定目录中文件夹和文件的总和,而不用关心 子目录 。我想获取目录及其子目录中所有文件的数量。 PS:返回所有文件和文件夹的总和几乎无关紧要。 任何帮助表示赞赏,谢谢 问题答案: 试试这个。 它可能会帮助您。

  • 本文向大家介绍Python如何获取文件路径/目录,包括了Python如何获取文件路径/目录的使用技巧和注意事项,需要的朋友参考一下 一、获取文件路径实现 1.1 获取当前文件路径 __file__变量其实有个问题,当文件被是被调用文件时__file__总是文件的绝对路径;但当文件是直接被执行的文件时,__file__并不总是文件的绝对路径,而是你执行该文件时给python传的路径。比如你是pyth

  • 问题内容: 我正在尝试检索目录中的所有图像,包括所有子目录。我目前正在使用 这可行,但是结果是: 我希望它一次执行整个目录分支,因此结果是: 非常感谢您的帮助,欢呼! 附注:如果我只需将所有子目录都包含在投资组合下,而不必用通配符具体说明每个目录,那也很好。 问题答案: 从示例