当前位置: 首页 > 知识库问答 >
问题:

流式传输中的网络洗牌

章博耘
2023-03-14

因此,keybygroupby会导致重新分区流的网络洗牌。据说它是相当昂贵的,因为它涉及到网络通信以及序列化和反序列化等。

举个例子,如果我运行以下操作符:

map(Mapper1).keyBy(0).map(Mapper2)

如果并行度为2,我将得到如下结果:

Mapper1(1) -\-/- Mapper2(1)
             X
Mapper1(2) -/-\- Mapper2(2)

并且最终mapper1中具有相同键的所有记录都被分配给mapper2中的相同分区。

共有1个答案

司空凌
2023-03-14

因此,Apache Flink缓冲任务的传出,然后将其发送到下一个任务进行处理。SetBufferTimeout是作业级别的参数,可以通过StreamExecutionEnvironment配置,该超时的默认值为100 ms。在此之后,即使缓冲区未满,也会自动发送缓冲区。

还有下面的链接对了解细节确实有帮助:

https://flink.apache.org/2019/06/05/flink-network-stack.html

 类似资料:
  • Spring webflux Json流不适用于转换为Mono的Flux对象

  • 介绍 常言道:欲练神功,必先练好基本功。之前做了一个关于IP路由,默认网关和掩码的问答贴,做完这个帖子觉得如果对网络知识点做一个系统的阐述,应该会很有帮助。 本系列文章着重于讲解网络管理实际应用中常常涉及的重要知识点,尽量以实用为主。准备写的几个章节暂时有(可能会有增减): 网络传输 交换机 VLAN与Trunk 路由(上) 路由(下) 链路聚合 IP地址与子网 NAT原理与配置 ICMP与ARP

  • 扩展说明 远程通讯的服务器及客户端传输实现。 扩展接口 org.apache.dubbo.remoting.Transporter org.apache.dubbo.remoting.Server org.apache.dubbo.remoting.Client 扩展配置 <!-- 服务器和客户端使用相同的传输实现 --> <dubbo:protocol transporter="xxx" />

  • UDP 和 TCP 的特点 UDP 首部格式 TCP 首部格式 TCP 的三次握手 TCP 的四次挥手 TCP 可靠传输 TCP 滑动窗口 TCP 流量控制 TCP 拥塞控制 1. 慢开始与拥塞避免 2. 快重传与快恢复 网络层只把分组发送到目的主机,但是真正通信的并不是主机而是主机中的进程。传输层提供了进程间的逻辑通信,传输层向高层用户屏蔽了下面网络层的核心细节,使应用程序看起来像是在两个传输层

  • 问题内容: 我正在尝试将csv文件作为附件下载流式传输。CSV文件的大小已达到4MB或更大,我需要一种让用户主动下载文件的方法,而不必等待所有数据都先创建并提交到内存中。 我首先使用了我自己的基于Django类的文件包装器。那失败了。然后,我在这里看到了一种使用生成器流式传输响应的方法: 如何使用Django流式传输HttpResponse 当我在生成器中引发错误时,可以看到我正在使用该函数创建正

  • 问题内容: 我正在构建一个Web应用程序,该服务器应从服务器 http://lscube.org/projects/feng 播放RTSP / RTP流。 HTML5视频/音频标签是否支持rtsp或rtp?如果没有,最简单的解决方案是什么?也许是VLC插件之类的东西。 问题答案: 从技术上讲“是” (但不是真的) HTML 5的标签与协议无关-不在乎。您将协议作为URL的一部分放在属性中。例如: