当前位置: 首页 > 知识库问答 >
问题:

使用python2下载嵌入网页中的pdf。7.

壤驷英叡
2023-03-14

我想下载pdf并将其存储在本地计算机上的文件夹中。以下是我想下载的pdf的链接https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738

我用python selenium和urllib编写了代码,但都未能下载。

import time, urllib
time.sleep(2)
pdfPath = "https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738"
pdfName = "jco.2018.77.8738.pdf"
f = open(pdfName, 'wb')
f.write(urllib.urlopen(pdfPath).read())
f.close()

共有2个答案

孙弘博
2023-03-14
from pathlib import Path
import requests
filename = Path("jco.2018.77.8738.pdf")
url = "https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738"
response = requests.get(url)
filename.write_bytes(response.content)
曹均
2023-03-14

处理请求要容易得多

import requests 

url = 'https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738'
pdfName = "./jco.2018.77.8738.pdf"
r = requests.get(url)

with open(pdfName, 'wb') as f:
    f.write(r.content)
 类似资料:
  • http://www.equibase.com/premium/chartemb.cfm?track=alb&racedate=06/17/2002&cy=usa&rn=1 我想下载嵌入式PDF。 我尝试了和的普通方法,但它们都不起作用。 null

  • 问题内容: 这是此网页中的链接 https://www.shareinvestor.com/prices/price_download.html#/?type=price_download_all_stocks_bursa。 然后将其保存到此目录”/home/vinvin/shKLSE/(我正在使用 pythonaywhere)。然后将其解压缩,然后将csv文件解压缩到目录中。 该代码一直运行到最

  • 问题内容: 我有一个内容div,其ID为“content”。在内容div中,我有一些图形和一些表格。当用户单击下载按钮时,我想将该div下载为pdf。有没有办法使用javascript或jQuery? 问题答案: 您可以使用jsPDF来完成 HTML: JavaScript:

  • 本文向大家介绍利用Python2下载单张图片与爬取网页图片实例代码,包括了利用Python2下载单张图片与爬取网页图片实例代码的使用技巧和注意事项,需要的朋友参考一下 前言 一直想好好学习一下Python爬虫,之前断断续续的把Python基础学了一下,悲剧的是学的没有忘的快。只能再次拿出来滤了一遍,趁热打铁,通过实例来实践下,下面这篇文章主要介绍了关于Python2下载单张图片与爬取网页的相关内容

  • 所以我有下面的问题。我收到一个文件,其中包含一组字体。这些字体没有嵌入到文件中。下面是一个简单的例子: 我希望将这些字体嵌入到中,这样它们就可以自包含并且始终可用。但事情似乎没那么简单。我正在使用进行处理。 我已经阅读并尝试了以下问题/答案: null

  • 我正在尝试开发一个小的网络爬虫,它下载网页并搜索特定部分的链接。但当我运行这段代码时,“href”标记中的链接会变短。如: 原文链接:“/kids-toys-action-figures-accessories/b/ref=toys_hp_catblock_actnfig?ie=utf8&node=165993011&pf_rd_m=atvpdkikx0der&pf_rd_s=merchandis