我正在为具有许多Flash文件的网站制作Greasemonkey脚本。我想对闪存进行哈希处理,问题是闪存文件最大为10 MB。
这很慢;我希望只能获取要散列的前80KB。最终结果将是一种将某些包含有害内容的Flash文件列入黑名单的简便方法。我的脚本如何仅抓取文件的前80
KB(或大约80 KB)?
发送的range
头在你的AJAX请求。
例如:
$.ajax ( {
url: 'http://TARGET_SERVER.COM/TARGET_PATH/TARGET_FILE.FLV',
headers: { Range: "bytes=0-80000" },
success: function (Resp) {
console.log(Resp);
}
} );
(对于与目标页面位于同一域中的文件。)
对于跨域文件,请使用GM_xmlhttpRequest():
GM_xmlhttpRequest ( {
method: "GET",
url: 'http://TARGET_SERVER.COM/TARGET_PATH/TARGET_FILE.FLV',
headers: { Range: "bytes=0-80000" },
onload: function (Resp) {
console.log(Resp.responseText);
}
} );
问题内容: 我有一个非常大的数据集,我无法读取其中的整个数据集。因此,我正在考虑只读取其中的一个数据块进行训练,但是我不知道该怎么做。任何想法将不胜感激。 问题答案: 如果您只想读取前999,999行(非标题): 如果您只想读取1,000,000 … 1,999,999行 nrows :int,默认值无要读取的文件行数。对读取大文件有用* skiprows :类似于列表或整数的行号,在文件开始处要
问题内容: 我在python中将selenium与webdriver一起使用,以从站点下载csv文件。该文件将下载到指定的下载目录中。这是我的代码的概述 我需要将此csv的内容发送到终端。许多具有随机名称的相似文件将被下载到同一文件夹中,因此无法通过文件名访问文件,因为我不知道它将是什么提前 问题答案: 这个答案是由以前的堆栈溢出问题,答案以及本文中的注释组成的,所以谢谢大家。 我为这个解决方案结
问题内容: 我每天都有大量的CSV文件要从Yahoo Finance下载。我希望我的应用程序读取文件的创建日期(在我的计算机上,而不是服务器上)。如果创建日期早于今天,则应下载新文件(因为它将具有新数据)。如果不是,则不应该下载新文件,并且相关计算器(本质上就是我的应用程序)应该将上次下载的文件用于特定的股票代码。 我进行了一些谷歌搜索,并找到了Apache POI项目。 这是最好的方法吗?有没有
进度条可以获取到,但是我获取不到blob了。提示错误 TypeError: Failed to execute 'blob' on 'Response': body stream already read。
问题内容: 我正在尝试实现基本的词法分析器。目前,我在文件解析方面陷入困境。 这是我的栏位,称为“ p ++。ppp” 解析文件时,我得到:但是p ++。ppp是文件名! 同样,当我调试时,它读取文件名,然后退出。我想念什么? 问题答案: 您误解了的API 。从文档的构造函数: 构造一个新的Scanner,该扫描器生成从指定字符串扫描的值。 参数: 源 -一个字符串,扫描 这不是文件名-只是一个字
我尝试读取数据块中的dbc文件(从s3存储桶装载)。文件路径是: 如何使用火花读取此文件? 我尝试了下面的代码: 但它生成并错误: 谢谢帮忙!