二进制流中的open和io.BytesIO之间的区别

翟承志

2023-03-14

问题内容：

我正在学习有关在Python中使用流的知识，并且我注意到IO文档说以下内容：

创建二进制流的最简单方法是使用open（）在模式字符串中带有“ b”的位置：

f = open("myfile.jpg", "rb")

内存中的二进制流也可以作为BytesIO对象使用：

f = io.BytesIO(b"some initial binary data: \x00\x01")

f由open和f定义之间有什么区别BytesIO。换句话说，什么使“内存中的二进制流”与它有什么不同open？

问题答案：

为了简单起见，让我们考虑现在写而不是读。

所以当你使用open()像说：

with open("test.dat", "wb") as f:
    f.write(b"Hello World")
    f.write(b"Hello World")
    f.write(b"Hello World")

执行后，test.dat将创建一个名为3x的文件Hello World。数据写入文件后将不会保留在内存中（除非有名称保留）。

现在，当您考虑io.BytesIO()改为：

with io.BytesIO() as f:
    f.write(b"Hello World")
    f.write(b"Hello World")
    f.write(b"Hello World")

它不是将内容写入文件，而是写入内存缓冲区。换句话说，一块RAM。本质上，编写以下内容将是等效的：

buffer = b""
buffer += b"Hello World"
buffer += b"Hello World"
buffer += b"Hello World"

对于带有with语句的示例，最后还有一个del buffer。

这里的主要区别是优化和性能。io.BytesIO能够进行一些优化，使其比简单地将所有b"Hello World"一个接一个的连接更快。

为了证明这一点，这里有一个小基准：

Concat：1.3529秒
字节IO：0.0090秒

import io
import time

begin = time.time()
buffer = b”“
for i in range(0, 50000):
buffer += b”Hello World”
end = time.time()
seconds = end - begin
print(“Concat:”, seconds)

begin = time.time()
buffer = io.BytesIO()
for i in range(0, 50000):
buffer.write(b”Hello World”)
end = time.time()
seconds = end - begin
print(“BytesIO:”, seconds)

除了提高性能外，使用BytesIO代替连接还具有BytesIO可以代替文件对象使用的优点。假设您有一个函数期望文件对象写入。然后，您可以为它提供内存中的缓冲区，而不是文件。

区别在于，open("myfile.jpg", "rb")仅加载并返回myfile.jpg;的内容；而BytesIO同样，它只是一个包含一些数据的缓冲区。

因为BytesIO这只是一个缓冲区-如果您想稍后将内容写入文件-您必须执行以下操作：

buffer = io.BytesIO()
# ...
with open("test.dat", "wb") as f:
    f.write(buffer.getvalue())

另外，您没有提到版本；我正在使用Python3。与示例相关：我在使用with语句而不是调用f.close()

二进制流中的open和io.BytesIO之间的区别

相关阅读

相关文章

相关问答

相关工具

相关文档