当前位置：首页 > 面试题库 >

如何在Python中读取大文件的特定部分

汪才

2023-03-14

问题内容：

给定一个大文件（数百MB），我将如何使用Python快速读取文件中特定起始索引和结束索引之间的内容？

本质上，我正在寻找一种更有效的方法：

open(filename).read()[start_index:end_index]

问题答案：

您可以seek将文件放入文件，然后从那里读取一定数量。Seek允许您获取文件中的特定偏移量，然后可以将读取限制为该范围内的字节数。

with open(filename) as fin:
    fin.seek(start_index)
    data = fin.read(end_index - start_index)

那只会读取您要查找的数据。

类似资料：

python-从文件的特定行中读取文件

问题内容：我不是在谈论特定的行号，因为我正在读取具有相同格式但长度不同的多个文件。说我有这个文本文件：我希望你知道我的意思。我正在考虑遍历文件，然后使用正则表达式搜索以找到“开始”和“结束”的行号，然后使用线缓存从开始行读取到结束行。但是如何获得行号？我可以使用什么功能？问题答案：如果您只想要和之间的文本块，则可以执行以下操作：实际上，您不需要操纵行号即可读取开始和结束标记之间的数据。
在python中以特定顺序读取文件

问题内容：可以说我在一个文件夹中有三个文件：file9.txt，file10.txt和file11.txt，我想按此特定顺序读取它们。谁能帮我这个？现在我正在使用代码它先读取file10.txt，然后读取file11.txt，然后读取file9.txt。有人可以帮助我如何获得正确的订单吗？问题答案：文件系统上的文件未排序。您可以使用函数自己对生成的文件名进行排序：请注意，您代码中的调
如何部分读取巨大的CSV文件？

问题内容：我有一个很大的csv文件，因此无法将它们全部读入内存。我只想阅读和处理其中的几行内容。所以我正在Pandas中寻找一个可以处理此任务的函数，基本的python可以很好地处理此任务：但是，如果我在熊猫中这样做，我总是会读第一行：我正在寻找一些更简单的方法来处理熊猫中的这项任务。例如，如果我想读取1000到2000的行。如何快速执行此操作？我想使用熊猫，因为我想将数据读入数据框。问
从python中的文本文件读取特定列

问题内容：我有一个文本文件，其中包含一个由数字组成的表格，例如： 5 10 6 6 20 1 7 30 4 8 40 3 9 23 1 4 13 6 例如，如果我想要仅包含在第二列中的数字，我该如何将该列提取到列表中？问题答案：您可以使用列表理解来做同样的事情 Docs 返回字符串的单词列表。如果不存在可选的第二个参数sep或“无”，则单词将由任意的空白字符字符串（空格，制表符，换行符，返回
Python-如何逐行读取大文件

问题内容：我想遍历整个文件的每一行。一种方法是读取整个文件，将其保存到列表中，然后遍历感兴趣的行。此方法占用大量内存，因此我正在寻找替代方法。到目前为止，我的代码：执行此代码将显示错误消息：。有什么建议么？目的是计算成对的字符串相似度，这意味着对于文件中的每一行，我要计算每隔一行的距离。问题答案：正确的，完全Python的读取文件的方法如下：该with语句处理文件的打开和关闭，包括
在特定点读取文件中的行

所以我正在写一个代码来获取scanf一个文本文件并返回一个格式化的文本消息日志。我一直在想，当文件扫描行“332982000 20555552002 205551001 7 Webb先生，我能问你一个问题吗？”时，如何在某一点扫描文件中的字符串，并打印E.X点以外的所有字符串我将前4个数字扫描为整数，并将其余写入的文本扫描到从“Mr.Webb”开始的字符数组中。我尝试使用一个for循环与fsca

如何在Python中读取大文件的特定部分

相关阅读

相关文章

相关问答

相关工具

相关文档