当前位置: 首页 > 面试题库 >

二进制流中的open和io.BytesIO之间的区别

翟承志
2023-03-14
问题内容

我正在学习有关在Python中使用流的知识,并且我注意到IO文档说以下内容:

创建二进制流的最简单方法是使用open()在模式字符串中带有“ b”的位置:

f = open("myfile.jpg", "rb")

内存中的二进制流也可以作为BytesIO对象使用:

f = io.BytesIO(b"some initial binary data: \x00\x01")

fopenf定义之间有什么区别BytesIO。换句话说,什么使“内存中的二进制流”与它有什么不同open


问题答案:

为了简单起见,让我们考虑现在写而不是读。

所以当你使用open()像说:

with open("test.dat", "wb") as f:
    f.write(b"Hello World")
    f.write(b"Hello World")
    f.write(b"Hello World")

执行后,test.dat将创建一个名为3x的文件Hello World。数据写入文件后将不会保留在内存中(除非有名称保留)。

现在,当您考虑io.BytesIO()改为:

with io.BytesIO() as f:
    f.write(b"Hello World")
    f.write(b"Hello World")
    f.write(b"Hello World")

它不是将内容写入文件,而是写入内存缓冲区。换句话说,一块RAM。本质上,编写以下内容将是等效的:

buffer = b""
buffer += b"Hello World"
buffer += b"Hello World"
buffer += b"Hello World"

对于带有with语句的示例,最后还有一个del buffer

这里的主要区别是优化和性能。io.BytesIO能够进行一些优化,使其比简单地将所有b"Hello World"一个接一个的连接更快。

为了证明这一点,这里有一个小基准:

  • Concat:1.3529秒
  • 字节IO:0.0090秒

    import io
    import time

    begin = time.time()
    buffer = b”“
    for i in range(0, 50000):
    buffer += b”Hello World”
    end = time.time()
    seconds = end - begin
    print(“Concat:”, seconds)

    begin = time.time()
    buffer = io.BytesIO()
    for i in range(0, 50000):
    buffer.write(b”Hello World”)
    end = time.time()
    seconds = end - begin
    print(“BytesIO:”, seconds)

除了提高性能外,使用BytesIO代替连接还具有BytesIO可以代替文件对象使用的优点。假设您有一个函数期望文件对象写入。然后,您可以为它提供内存中的缓冲区,而不是文件。

区别在于,open("myfile.jpg", "rb")仅加载并返回myfile.jpg;的内容;而BytesIO同样,它只是一个包含一些数据的缓冲区。

因为BytesIO这只是一个缓冲区-如果您想稍后将内容写入文件-您必须执行以下操作:

buffer = io.BytesIO()
# ...
with open("test.dat", "wb") as f:
    f.write(buffer.getvalue())

另外,您没有提到版本; 我正在使用Python3。与示例相关:我在使用with语句而不是调用f.close()



 类似资料:
  • 本文向大家介绍Java 8中流和集合之间的区别,包括了Java 8中流和集合之间的区别的使用技巧和注意事项,需要的朋友参考一下 Java Collections框架用于存储和处理数据组。它是一个内存中的数据结构,应先计算集合中的每个元素,然后才能将其添加到集合中。 Stream API仅用于处理数据组。它不会修改实际的集合,它们仅根据流水线方法提供结果。 序号 键 馆藏 流 1个 基本的 流API

  • 问题内容: 在阅读了这个答案和Robert Love的“LinuxKernelDevelopment”之后,随后在系统调用中,我发现Linux中的进程和线程(几乎)与内核没有区别。它们之间有一些调整(在引用的SO问题中被讨论为“更多共享”或“更少共享”),但是我仍然有一些问题需要解答。 我最近开发了一个包含几个POSIX线程的程序,并决定在此前提下进行试验。在创建两个线程的进程中,所有线程当然都会

  • 本文向大家介绍进程和线程之间的区别,包括了进程和线程之间的区别的使用技巧和注意事项,需要的朋友参考一下 进程是活动程序,即正在执行的程序。它不仅包含程序代码,还包括程序计数器,进程堆栈,寄存器,程序代码等。与此相比,程序代码只是文本部分。 线程是可以由调度程序独立管理的轻量级进程。它使用并行性提高了应用程序性能。线程与它的对等线程共享信息,如数据段,代码段,文件等,而该线程包含其自己的寄存器,堆栈

  • 问题内容: 我想知道的是最有效的代码转换方式(迅速2): 十进制到二进制 二进制到十进制 十进制到十六进制 十六进制到十进制 二进制到十六进制 十六进制到二进制 我已经有了实现该目标的基本且漫长的方法,但是我想找到一种非常有效的方法。 抱歉,问题有点长… 问题答案: 两者和都有带有(基)的初始化程序。结合这些,您可以实现所有转化:

  • 本文向大家介绍镜像和复制之间的区别,包括了镜像和复制之间的区别的使用技巧和注意事项,需要的朋友参考一下 镜射 镜像是指为主数据库服务器保留备份数据库服务器。如果由于某种原因主数据库已关闭,则可以将镜像数据库用作主数据库的备用数据库。原则上,一次只有一台数据库服务器处于活动状态,并且仅从一台处于活动状态的服务器提供对数据库的请求。 复写 复制是指保持数据库的多个副本分布在多个地理位置。复制的经典示例

  • 问题内容: 当我在MySQL中使用浮点和十进制数据类型时,它有什么区别? 我什么时候应该使用哪个? 问题答案: 这是我对此有疑问时发现的。 十进制完全符合这种情况下的预期,截断了其余部分,从而丢失了1/3的部分。 因此对于总和,小数点更好,但是对于除数,浮点数更好,当然到了某种程度。我的意思是,使用DECIMAL不会以任何方式为您提供“防故障算法”。 希望这可以帮助。

  • 我在尝试Python-Selenium的XPath。 我使用这个链接来尝试教程中的一些XPath: 所以我尝试了XPaths的这两个变体。 返回9个结果 “//”如何匹配5个更多的结果?

  • 问题内容: 我有两个问题,可能需要一些帮助来理解它们。 和之间有什么区别?我知道这 意味着在单独的外壳中运行命令,然后将其传递给变量。有人可以帮助我理解这一点吗?如果我错了,请纠正我。 如果我们可以使用并且效果很好,那我为什么不能使用它呢?两者的执行周期有何不同? 问题答案: 语法是令牌级别的,因此美元符号的含义取决于其所在的令牌。表达式是现代代名词,代表命令替换;这意味着运行并将其输出放在此处。