当前位置: 首页 > 面试题库 >

您如何以编程方式下载Java网页

寇坚成
2023-03-14
问题内容

我希望能够获取网页的html并将其保存到String,因此可以对其进行一些处理。另外,我该如何处理各种类型的压缩。

我将如何使用Java做到这一点?


问题答案:

这是一些使用Java的URL类的经过测试的代码。我建议比在这里处理异常或将异常传递到调用堆栈方面做得更好。

public static void main(String[] args) {
    URL url;
    InputStream is = null;
    BufferedReader br;
    String line;

    try {
        url = new URL("http://stackoverflow.com/");
        is = url.openStream();  // throws an IOException
        br = new BufferedReader(new InputStreamReader(is));

        while ((line = br.readLine()) != null) {
            System.out.println(line);
        }
    } catch (MalformedURLException mue) {
         mue.printStackTrace();
    } catch (IOException ioe) {
         ioe.printStackTrace();
    } finally {
        try {
            if (is != null) is.close();
        } catch (IOException ioe) {
            // nothing to see here
        }
    }
}


 类似资料:
  • 问题内容: 我需要从网站下载图像,并且具有登录名和密码,但是如果我仅使用URL下载图像,它将抛出异常:会话中没有任何值。 我想我需要登录该网站,然后才能以编程方式下载该图像。 你有什么解决办法 ?提前致谢 ! 问题答案: 我想提到HtmlUnit。这是一个无头浏览器,带有Java脚本。

  • 问题内容: 有一个网页,我想从中检索某个字符串。为此,我需要登录,单击一些按钮,填充文本框,单击另一个按钮-然后出现字符串。 如何编写Java程序以自动执行此操作?是否有用于此目的的有用库? 谢谢 问题答案: 试试HtmlUnit HtmlUnit是“用于Java程序的GUI更少的浏览器”。它为HTML文档建模,并提供一个API,使您可以调用页面,填写表单,单击链接等,就像在“常规”浏览器中一样。

  • 问题内容: 如何在不启动GUI的情况下如何编写python脚本来读取Tensorboard日志文件,提取损失和准确性以及其他数字数据? 问题答案: 您可以使用TensorBoard的Python类或脚本来提取数据: 如何从TensorBoard导出数据? 如果您想导出数据以在其他地方可视化(例如iPython Notebook),那也是可能的。您可以直接依赖TensorBoard用来加载数据的基础

  • 我正在尝试下载/导出谷歌驱动器中创建的“谷歌表单”。谷歌驱动器API通常提供“exportlinks”来下载任何谷歌驱动器文件类型。对于Google Forms,Google drive SDK API不会为mimetype“application/vnd.google-apps.form”返回任何“exportlinks”或“downloadURL”。

  • 问题内容: JFrame与用户按下X关闭按钮或按在Windows上)相同,获得关闭的正确方法是什么? 我通过以下方式设置了我想要的默认关闭操作: 它完全符合我想要的上述控件的功能。这个问题不是关于这个的。 我真正想做的是使GUI的行为与按下X关闭按钮的行为相同。 假设我要扩展,然后通过来添加我的适配器的实例作为侦听器。我想看到的调用相同的序列通过,以及作为将与出现X关闭按钮。可以这么说,撕开窗户与

  • 我想从一个谷歌文档中下载某个修订版。从Drive REST API v2中,我得到了以下链接: