当前位置: 首页 > 面试题库 >

Linux上真的没有异步块I / O吗?

郭均
2023-03-14
问题内容

考虑一个受CPU约束但又具有高性能I / O要求的应用程序

我正在将Linux文件I /
O与Windows进行比较,我完全看不出epoll将如何帮助Linux程序。内核会告诉我文件描述符“可以读取”,但是我仍然必须调用阻塞read()来获取数据,并且如果我想读取兆字节,很显然它将阻塞。

在Windows上,我可以创建带有OVERLAPPED设置的文件句柄,然后使用非阻塞I / O,并在I /
O完成时得到通知,并使用该完成功能中的数据。我不需要花费应用程序级别的时钟时间来等待数据,这意味着我可以将线程数精确地调整为内核数,并获得100%的高效CPU利用率。

如果我必须在Linux上模拟异步I / O,则必须分配一定数量的线程来执行此操作,这些线程将花费一点时间来做CPU事情,并且会花费大量时间来阻塞I /
O,加上与这些线程之间的消息传递会产生开销。因此,我将过度订购或未充分利用CPU内核。

我将mmap()+ madvise()(WILLNEED)视作“可怜的人的异步I / O”,但它仍然无法一路走到尽头,因为完成后我无法收到通知-
我有为“猜测”,如果我猜为“错误”,我将最终阻止内存访问,等待数据来自磁盘。

Linux似乎在io_submit中启动了异步I / O,并且它似乎也有一个用户空间POSIX
aio实现,但是这种方式已经存在了一段时间,而且我知道没有人会为这些系统提供关键服务,高性能的应用程序。

Windows模型大致如下所示:

  1. 发出异步操作。
  2. 将异步操作绑定到特定的I / O完成端口。
  3. 等待操作在该端口上完成
  4. I / O完成后,等待端口的线程将解除阻塞,并返回对未决I / O操作的引用。

第1/2步通常是一件简单的事情。步骤3/4通常是使用工作线程池完成的,而不是(不一定)与发出I / O的线程相同。该模型与boost ::
asio提供的模型有些相似,除了boost :: asio实际上并没有为您提供基于异步块的(磁盘)I / O。

与Linux中的epoll的不同之处在于,在第4步中,尚未发生任何I / O -将第1步提升到第4步之后,如果您确切地知道自己需要什么,则将其“倒退”。

对大量嵌入式,桌面和服务器操作系统进行了编程之后,我可以说这种异步I /
O模型对于某些类型的程序来说是很自然的。它也是高吞吐量和低开销的。我认为这是Linux I / O模型在API级别上仍然存在的真正缺陷之一。


问题答案:

Peter Teoh间接指出的真实答案是基于io_setup()和io_submit()的。具体来说,由Peter指示的“
aio_”功能是基于线程的glibc用户级仿真的一部分,这不是有效的实现。真正的答案是:

io_submit(2)
io_setup(2)
io_cancel(2)
io_destroy(2)
io_getevents(2)

请注意,日期为2012-08的手册页指出,该实现尚未成熟到可以代替glibc用户空间仿真的程度:

http://man7.org/linux/man-pages/man7/aio.7.html

该实现尚未成熟到可以使用内核系统调用完全重新实现POSIX AIO实现的地步。

因此,根据我可以找到的最新内核文档,Linux尚没有成熟的基于内核的异步I / O模型。而且,如果我假设记录的模型实际上已经成熟,那么从recv()vs
read()的角度来看,它仍然不支持部分I / O。



 类似资料:
  • 支持Python异步。包括对Core和ORM使用的支持,使用了异步兼容的方言。 1.4 新版功能. 注解 从SQLAlChemy 1.4.3开始的异步扩展现在可以被认为是 测试级 软件。API细节可能会更改,但是在这一点上,不太可能有重大的向后不兼容更改。 参见 对内核和ORM的异步IO支持 -初始功能发布 异步集成 -示例脚本演示了asyncio扩展中核心和ORM使用的工作示例。 Asyncio

  • 问题内容: 我正在寻找在Linux上执行异步文件I / O的最有效方法。 POSIX glibc实现使用用户空间中的线程。 本地aio内核api仅适用于无缓冲操作,存在用于内核以添加对缓冲操作的支持的补丁程序,但是这些补丁程序已有3年的历史了,似乎没有人关心将它们集成到主线中。 我发现了许多其他允许异步I / O的想法,概念和补丁,尽管其中大多数都在3年以上的文章中。在当今的内核中,这到底是什么呢

  •  最大的特点就是采用异步式 I/O 与事件驱动的架构设计。对于高并发的解决方案,传统的架构是多线程模型,也就是为每个业务逻辑提供一个系统线程,通过系统线程切换来弥补同步式 I/O 调用时的时间开销。    

  • 传统的 Java I/O API 在应对不同的传输协议时需要使用不同的类型和方法。例如:java.net.Socket 和 java.net.DatagramSocket 它们并不具有相同的超类型,因此,这就需要使用不同的调用方式执行 socket 操作。 这种模式上的不匹配使得在更换一个网络应用的传输协议时变得繁杂和困难。由于(Java I/O API)缺乏协议间的移植性,当你试图在不修改网络传

  • “异步”这个名词其实很早就诞生了,但它的大规模流行确实在 Web 2.0 浪潮中,它伴随着 Ajax 的第一个 A(Asnchronous)席卷了 Web。Node 在出现之前,最习惯异步编程的程序员莫过于前端工程师了。前端编程算 GUI 编程的一种,其中充斥着各种 Ajax 和事件,这些都是典型的异步应用场景。 但事实上,异步早就存在于操作系统的底层。在底层系统中,异步通信信号量、消息等方式有了

  • 实时的web特性通常需要为每个用户一个大部分时间都处于空闲的长连接. 在传统的同步web服务器中,这意味着需要给每个用户分配一个专用的线程,这样的开销是十分巨大的. 为了减小对于并发连接需要的开销,Tornado使用了一种单线程事件循环的方式. 这意味着所有应用程序代码都应该是异步和非阻塞的,因为在同一时刻只有一个操作是有效的. 异步和非阻塞这两个属于联系十分紧密而且通常交换使用,但是它们并不完全