当前位置：首页 > 面试题库 >

使用请求在python中下载大文件

徐麒

2023-03-14

问题内容：

请求是一个非常不错的库。我想用它来下载大文件（> 1GB）。问题是不可能将整个文件保留在内存中，我需要分块读取它。这是以下代码的问题

import requests

def DownloadFile(url)
    local_filename = url.split('/')[-1]
    r = requests.get(url)
    f = open(local_filename, 'wb')
    for chunk in r.iter_content(chunk_size=512 * 1024): 
        if chunk: # filter out keep-alive new chunks
            f.write(chunk)
    f.close()
    return

由于某种原因，它无法按这种方式工作。仍将响应加载到内存中，然后再将其保存到文件中。

更新

如果你需要一个小型客户端（Python 2.x /3.x），可以从FTP下载大文件，则可以在此处找到它。它支持多线程和重新连接（它确实监视连接），还可以为下载任务调整套接字参数。

问题答案：

使用以下流代码，无论下载文件的大小如何，都限制了Python内存的使用：

def download_file(url):
    local_filename = url.split('/')[-1]
    # NOTE the stream=True parameter below
    with requests.get(url, stream=True) as r:
        r.raise_for_status()
        with open(local_filename, 'wb') as f:
            for chunk in r.iter_content(chunk_size=8192): 
                if chunk: # filter out keep-alive new chunks
                    f.write(chunk)
                    # f.flush()
    return local_filename

请注意，使用返回的字节数iter_content不完全是chunk_size;; 它应该是一个通常更大的随机数，并且在每次迭代中都应该有所不同。

类似资料：

使用python请求下载CSV

问题内容：这是我的代码：这使我可以访问csv文件。我尝试了其他方法来处理下载：这将给csv文件一个字符串：这将打印第一行并返回错误：_csv.Error：在未引用的字段中看到换行符这将在每行中打印一个字母，并且不会打印出整个内容：我的问题是：在这种情况下读取CSV文件的最有效方法是什么。以及如何下载。谢谢问题答案：这应该有助于：输出样本：答案相关的问题: 使用此功能将csv加
使用ajax请求下载文件

问题内容：我想在单击按钮时发送“ ajax下载请求”，所以我尝试了这种方式： javascript： download.php：但是没有按预期工作，我该怎么办？先感谢您问题答案： 2015年4月27日更新进入HTML5场景的是download属性。它支持在Firefox和Chrome，并很快来到IE11。根据您的需求，只要您要下载的文件与您的网站位于同一来源，就可以使用它代替AJAX请求（
JavaScript使用ajax请求下载文件

问题内容：当我单击按钮时，我想发送“ ajax下载请求”，因此我尝试了这种方式： javascript： download.php：但是没有按预期工作，我该怎么办？先感谢您问题答案：进入HTML5场景的是download属性。它支持在Firefox和Chrome，并很快来到IE11。根据您的需求，只要您要下载的文件与您的网站位于同一来源，就可以使用它代替AJAX请求（或使用）。您始终可以
使用Python请求和响应模拟下载文件

我有一些python代码，它使用请求成功地从URL下载图像，并将其保存到中。我想测试一下，它应该做什么。我使用响应来测试JSON文件的获取，但我不确定如何模拟获取文件的行为。我假设这类似于嘲笑一个标准的响应，就像下面一样，但是我想我忽略了如何将设置为文件... 更新：在Ashafix的评论之后，我正在尝试这个（python 3）：但随后，当我正在测试的代码尝试执行我得到的请求时：感觉几乎是对
在Python请求中使用cookies.txt文件

问题内容：我正在尝试使用带有Python请求的文件（使用Chrome扩展程序生成）访问经过身份验证的网站：它不会引发任何错误或异常，但是会错误地显示登录屏幕。但是，我知道我的cookie文件是有效的，因为我可以通过使用它成功地检索我的内容。知道我在做什么错吗？编辑：我跟踪，并且可以验证cookie被正确解析（即他们的正确的价值观，，等标记）。但是由于事务仍在生成登录表单，因此似乎必须做其他
使用Python请求模块下载并保存PDF文件

问题内容：我正在尝试从网站下载PDF文件并将其保存到磁盘。我的尝试因编码错误而失败，或者导致PDF空白。我知道这是某种编解码器问题，但我似乎无法使其正常工作。问题答案：在这种情况下，您应该使用：从文件：对于非文本请求，您还可以字节形式访问响应主体：因此，这意味着：将输出作为字符串对象返回，在下载文本文件时使用它。如HTML文件等并以字节对象返回输出，在下载二进制文件时使用它

相关阅读

使用Python请求模块下载并保存PDF文件 Python-使用请求将文件直接下载到内存仅使用python请求下载文档的一部分使用Python请求库保存大文件 Python-如何使用请求下载图像

相关文章

Struts2下载文件实例请求的处理链路 + 8大组件 RESTful JAX-RS文件下载示例 HTTP-请求 Python Visual Studio下载和安装教程

相关问答

使用InpuStream下载大文件如何使用请求[duplicate]下载二进制文件为什么不能使用ajax请求下载文件？使用python -m下载文件？如何使用请求下载图像

相关工具

中文 Python 新浪微博请求图片下载和保存 Google 图书下载工具图片下载和浏览

相关文档

StackExchange.Redis 中文使用文档 Python XlsxWriter 中文文档 Python Cookbook 中文版 Python 中文教程 Violent Python 中文版