当前位置：首页 > 面试题库 >

如何从具有.html扩展名的网页中以编程方式下载pdf文件？

薛坚

2023-03-14

问题内容：

我在这个论坛上已经审查了所有类似的问题（不仅是这个！），并尝试了所有这些方法，但是仍然无法以编程方式下载测试文件：http : //pdfobject.com/markup/examples/full-browser-
window.html

以下是我要下载的测试文件的直接链接。这是一个具有开放访问权限的测试pdf文件，因此任何人都可以使用它来测试下载方法。

如何下载此特定文件，使其具有pdf扩展名？

问题答案：

要下载文件，也许您可以尝试执行以下操作：

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;

public final class FileDownloader {

    private FileDownloader(){}

    public static void main(String args[]) throws IOException{
        download("http://pdfobject.com/pdf/sample.pdf", new File("sample.pdf"));
    }

    public static void download(final String url, final File destination) throws IOException {
        final URLConnection connection = new URL(url).openConnection();
        connection.setConnectTimeout(60000);
        connection.setReadTimeout(60000);
        connection.addRequestProperty("User-Agent", "Mozilla/5.0");
        final FileOutputStream output = new FileOutputStream(destination, false);
        final byte[] buffer = new byte[2048];
        int read;
        final InputStream input = connection.getInputStream();
        while((read = input.read(buffer)) > -1)
            output.write(buffer, 0, read);
        output.flush();
        output.close();
        input.close();
    }
}

类似资料：

您如何以编程方式下载Java网页

问题内容：我希望能够获取网页的html并将其保存到，因此可以对其进行一些处理。另外，我该如何处理各种类型的压缩。我将如何使用Java做到这一点？问题答案：这是一些使用Java的URL类的经过测试的代码。我建议比在这里处理异常或将异常传递到调用堆栈方面做得更好。
如何以编程方式从网站下载图像？

问题内容：我需要从网站下载图像，并且具有登录名和密码，但是如果我仅使用URL下载图像，它将抛出异常：会话中没有任何值。我想我需要登录该网站，然后才能以编程方式下载该图像。你有什么解决办法？提前致谢！问题答案：我想提到HtmlUnit。这是一个无头浏览器，带有Java脚本。
如何以编程方式访问Java中的网页

问题内容：有一个网页，我想从中检索某个字符串。为此，我需要登录，单击一些按钮，填充文本框，单击另一个按钮-然后出现字符串。如何编写Java程序以自动执行此操作？是否有用于此目的的有用库？谢谢问题答案：试试HtmlUnit HtmlUnit是“用于Java程序的GUI更少的浏览器”。它为HTML文档建模，并提供一个API，使您可以调用页面，填写表单，单击链接等，就像在“常规”浏览器中一样。
如何从JavaScript网页下载完整的html？

我想下载一个网页的完整html，我已经写了一些代码来做到这一点。然而，当我回头看下载的html时，我发现只有大约一半的html存在。我认为这是因为网页是动态的，当你与网页交互时，会加载更多的信息。我一直在尝试使用PhantomJS与ChromeDriver Manager协调一致地执行此操作，但运气不佳。这是只下载部分html的代码（我再次相信，因为页面是动态的）：这是我对PhantomJS的尝
如何隐藏. php扩展从网页？

这个代码有问题吗？
以编程方式从驱动器下载exportLink

我想从一个谷歌文档中下载某个修订版。从Drive REST API v2中，我得到了以下链接：

相关阅读

如何递归搜索具有某些扩展名的文件？使Chrome扩展程序下载文件如何在Swift中从文件扩展名中拆分文件名？如何从uri确定文件的文件扩展名如何使用NGINX从网址中同时删除.php和.html扩展名？

相关文章

Kotlin 扩展 Flask扩展从Nexus下载构件 Objective-C扩展 7.5.4 WebView文件下载

相关问答

如何以编程方式下载公共谷歌驱动器文件？如何加载图像从mipmap文件夹以编程方式？[重复]如何grep文件扩展名以编程方式从共享Dropbox文件夹链接下载内容如何以编程方式执行展开segue？

相关工具

解析html网页的数据 Chromium Updater 扩展 Tweetmeme Chrome 扩展 IconButton 扩展版 Google 图书下载工具

相关文档

Rexx 重构的扩展执行程序中文教程 Flask 扩展文档汇总 Go 网络编程汇编中文教程 Kivy 中文编程指南