我在这个论坛上已经审查了所有类似的问题(不仅是这个!),并尝试了所有这些方法,但是仍然无法以编程方式下载测试文件:http : //pdfobject.com/markup/examples/full-browser-
window.html
以下是我要下载的测试文件的直接链接。这是一个具有开放访问权限的测试pdf文件,因此任何人都可以使用它来测试下载方法。
如何下载此特定文件,使其具有pdf扩展名?
要下载文件,也许您可以尝试执行以下操作:
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
public final class FileDownloader {
private FileDownloader(){}
public static void main(String args[]) throws IOException{
download("http://pdfobject.com/pdf/sample.pdf", new File("sample.pdf"));
}
public static void download(final String url, final File destination) throws IOException {
final URLConnection connection = new URL(url).openConnection();
connection.setConnectTimeout(60000);
connection.setReadTimeout(60000);
connection.addRequestProperty("User-Agent", "Mozilla/5.0");
final FileOutputStream output = new FileOutputStream(destination, false);
final byte[] buffer = new byte[2048];
int read;
final InputStream input = connection.getInputStream();
while((read = input.read(buffer)) > -1)
output.write(buffer, 0, read);
output.flush();
output.close();
input.close();
}
}
问题内容: 我希望能够获取网页的html并将其保存到,因此可以对其进行一些处理。另外,我该如何处理各种类型的压缩。 我将如何使用Java做到这一点? 问题答案: 这是一些使用Java的URL类的经过测试的代码。我建议比在这里处理异常或将异常传递到调用堆栈方面做得更好。
问题内容: 我需要从网站下载图像,并且具有登录名和密码,但是如果我仅使用URL下载图像,它将抛出异常:会话中没有任何值。 我想我需要登录该网站,然后才能以编程方式下载该图像。 你有什么解决办法 ?提前致谢 ! 问题答案: 我想提到HtmlUnit。这是一个无头浏览器,带有Java脚本。
问题内容: 有一个网页,我想从中检索某个字符串。为此,我需要登录,单击一些按钮,填充文本框,单击另一个按钮-然后出现字符串。 如何编写Java程序以自动执行此操作?是否有用于此目的的有用库? 谢谢 问题答案: 试试HtmlUnit HtmlUnit是“用于Java程序的GUI更少的浏览器”。它为HTML文档建模,并提供一个API,使您可以调用页面,填写表单,单击链接等,就像在“常规”浏览器中一样。
我想下载一个网页的完整html,我已经写了一些代码来做到这一点。然而,当我回头看下载的html时,我发现只有大约一半的html存在。我认为这是因为网页是动态的,当你与网页交互时,会加载更多的信息。我一直在尝试使用PhantomJS与ChromeDriver Manager协调一致地执行此操作,但运气不佳。这是只下载部分html的代码(我再次相信,因为页面是动态的): 这是我对PhantomJS的尝
这个代码有问题吗?
我想从一个谷歌文档中下载某个修订版。从Drive REST API v2中,我得到了以下链接: