当前位置: 首页 > 知识库问答 >
问题:

在Spark中通过公平调度实现并发

农明辉
2023-03-14

我的环境:我正在尝试通过Spark Thrift服务器连接Cassandra。然后,我在Hive Metastore中创建一个元表,其中保存了Cassandra表数据。在一个web应用程序中,我通过JDBC驱动程序连接到元表。我已经为Spark Thrift服务器启用了公平调度。

问题:当我通过JMeter为100个用户执行300秒的并发负载测试时,初始请求的响应时间为次秒(比如前30秒)。然后响应时间逐渐增加(像2到3秒)。当我检查Spark UI时,所有的作业都在不到100毫秒的时间内执行。我还注意到,当收到请求时,作业和任务处于待定阶段。因此,我假设,即使任务需要几秒钟的时间来执行,它们也是由调度程序提交的,并且有一个延迟时间。如何修复作业提交中的延迟?

<pool name="default">
    <schedulingMode>FAIR</schedulingMode>
    <weight>2</weight>
    <minShare>15</minShare>
  </pool>
  <pool name="test">
    <schedulingMode>FIFO</schedulingMode>
    <weight>2</weight>
    <minShare>3</minShare>
  </pool>

共有1个答案

龙永逸
2023-03-14

这不是队列中挂起的查询而其他查询正在运行的情况吗。尝试减少spark.locality。请等待输入1

 类似资料:
  • 一、背景 一般来说,JOB的执行就是FIFO的过程(先进先出),这样的方式资源得不到充分的使用。所以配置了一下公平调度。 二、配置实现 1、环境:hadoop0.20.2 2、拷贝/jz/hadoop-0.20.2/contrib/fairscheduler/hadoop-0.20.2-fairscheduler.jar到hadoop的lib目录下,并复制到集群所有机器上。 3、修改mapred-

  • 这是我第一次尝试配置纱线调度器,但它不像我希望的那样工作。集群最初作为FIFO工作,我试图让作业并行运行。我已经在yarn-site.xml的顶部添加了 然后添加文件/etc/hadoop/conf.empty/fail-scheduler.xml: 因此,在这之后,我停止并启动了yarn资源管理器,我在yarn应用控制台上看到了Fair Scheduler!但是,当尝试在集群上运行多个作业时,A

  • 本文向大家介绍请讲一下非公平锁和公平锁在reetrantlock里的实现过程是怎样的。相关面试题,主要包含被问及请讲一下非公平锁和公平锁在reetrantlock里的实现过程是怎样的。时的应答技巧和注意事项,需要的朋友参考一下 考察点:锁 如果一个锁是公平的,那么锁的获取顺序就应该符合请求的绝对时间顺序,FIFO。对于非公平锁,只要CAS设置同步状态成功,则表示当前线程获取了锁,而公平锁还需要判断

  • 我对YARN“公平调度器”有一个基本问题。根据“公平调度器-公平调度是一种将资源分配给应用程序的方法,以便所有应用程序在一段时间内平均获得相等的资源份额”的定义。 以下是我的理解和问题。 (1)如果多个应用程序在YARN上运行,那么它将确保所有应用程序在一段时间内获得或多或少相等的资源共享。 (2) 我的问题是,如果在纱线中此属性设置为true,那么在提交spark submit时使用以下配置会有

  • 我的应用程序是一个非WebSpring启动应用程序,使用WebClient进行内部get调用。 每次我启动它时,它都会返回我。 问题与webclient调用有关:当我执行block()时,一切正常。当我试图让它保持被动时,它抛出一个异常。 以下是我的主要方法: 这是我的网络客户电话: 以下是异常跟踪:

  • 我的理解是,旨在并发运行其参数,并且当协同程序执行等待表达式时,它为事件循环提供了安排其他任务的机会。考虑到这一点,我惊讶地发现下面的代码片段忽略了的一个输入。 据我所知,会发生以下事情: run(main())对事件循环执行任何必要的全局初始化,并安排main()执行。 实际上,这不是我观察到的。相反,整个程序相当于。我发现非常有趣的是,即使是代码的微小变化似乎也会重新引入公平。例如,如果我们有