当前位置: 首页 > 知识库问答 >
问题:

从远程超链接读取信息(知道通过超链接它将是csv文件,但找不到一般方法)[已关闭]

龙玄天
2023-03-14

我正在使用Python 3.4。我曾尝试在网络上找到解决方案,但仍然没有。

我有一个链接到csv文件(数据集)。

有没有办法从这个链接中获取信息,而不在本地目录中复制它?(例如,我没有足够的磁盘空间)

我想继续处理内存中的数据。(例如,我计划找出有多少数据,必须做一些数据挖掘和过滤的事情,目前不重要它会是什么)

共有1个答案

闾丘照
2023-03-14

请尝试以下操作:

import requests
r = requests.get('http://127.0.0.1/some_path/small.csv')
print len(r.content.split('\n')) -1

结果: 10

小的。csv文件如下所示:

1lpcfgokakmgnkcojhhkbfbldkacnbeo,6B5108
pjkljhe2ncpnkpknbcohdijeoejaedia,678425
apdfllc5aahabafndbhieahigkjlhalf,651374
aohghmighlieiainnegkcijnfilokake,591116
coobgpohoikkiipiblmjeljniedjpjpf,587200
dmgjnkhnkblpmfjpdakehnaikgdjllic,540979
felcaaldnbdncclmgdcncolpebgiejap,480535
aapocclcgogkmnckokdopfmhonfmgoek,480441
pdehmppfilefbolgganhfihpbmjlgebh,273609
nafaimnnclfjfedmmabolbppcngeolgf,105979

编辑:(由MHawke建议)

import requests
line_cnt=0
r = requests.get('http://127.0.0.1/some_path/small.csv',stream=True)
for i in r.iter_lines():
    if i.strip():
        line_cnt +=1
print (line_cnt)

此版本不计算空行,对于大型文件应该更有效,因为它使用iter\u行

iter_lines(chunk_size=512,decode_unicode=无,分隔符=无)

一次迭代一行响应数据。当在请求上设置stream=True时,这避免了将内容立即读入内存以获得较大的响应。

(注:不可再入境)

 类似资料:
  • 我试图使用APACHE POI XSSF使用相对路径创建到文件的超链接。当打开用Microsft Excel创建的。xlsx文件时,相对路径被修改,并且没有很好地链接。Microsoft Excel在路径前面添加一些“../../”。我试着用OpenOffice打开它,它工作得很好。此外,我用HSSF尝试了它,它在Microsoft Excel和OpenOffice中都工作。知道为什么会这样吗?这

  • 行内式 格式为 [link text](URL 'title text')。 ① 普通链接: [Google](http://www.google.com/) Google ② 指向本地文件的链接: [icon.png](./images/icon.png) icon.png ③ 包含 'title' 的链接: [Google](http://www.google.com/ "Google")

  • 主要有以下几种方式: 行内超链接 语法`链接文字 <URL>`_ 分开的超链接 用到链接的地方`链接文字`_, 定义链接的地方 .. _链接文字: URL 链接到指定文档 下载链接 外链接 访问 我的博客 ,可以了解更多信息。 访问 我的博客,可以了解更多信息。 我的博客地址是: https://www.wenjiangs.com ,以了解更多信息。 这篇文章参考的是:reStructuredTe

  • 主要内容:创建超链接,示例类表示类似于JavaFX的网页上的锚链接的超链接。 上面的代码生成以下结果。 创建超链接 以下代码使用默认构造函数创建超链接对象。然后它设置一个作为文本标题,最后添加点击事件处理程序。 实例方法定义超链接的文本标题。超链接类扩展了类,可以为超链接设置字体和填充。 以下代码将图像添加到超链接控件。 示例 更改超链接的字体,如下代码所示 - 上面的代码生成以下结果。

  • 超链接是万维网的基础,是它让整个Web成为一个整体,并获得生命。可以毫不夸张地说,整个Internet就是由超链接连接而成的。word也不例外,它也需要通过超链接实现各章节之间的互联,甚至链接到本文档之外的资源。 在前面,已经介绍了链接的动态样式和根据文件类型显示相应文件类型的图标,来提高网站的可访问性。本节主要介绍如何区分一个链接是指向本站点的另一个页面,还是指向另一个站点上的页面,并为指向站外

  • 本章介绍如何向单元格中的内容添加超链接。 通常,超链接用于访问任何Web URL,电子邮件或外部文件。 以下代码显示如何在单元格上创建超链接。 import java.io.File; import java.io.FileOutputStream; import org.apache.poi.common.usermodel.Hyperlink; import org.apache.poi.hs