当前位置: 首页 > 面试题库 >

多线程Java不能加速

黄弘盛
2023-03-14
问题内容

我已经在Java中实现了一个简单的并行合并排序算法。这将数组切成相等的部分,并将它们传递给每个线程独立地进行排序。在对数组段进行排序后,它们由单个线程合并。因为没有共享资源,所以在对子列表进行排序时不使用任何同步。合并结果数组的最后一个线程尽管等待其他线程完成。

当使用两个线程时,性能将提高近66%。当我使用4个线程时,花费的时间与2个线程版本没有什么不同。我在linux
2.6.40.6-0.fc15.i686.PAE和Intel Core i5上。

我正在使用unix time命令对时间进行基准测试(为数组分配了统一的随机整数)。在排序结束时,我正在检查数组排序是否正确(不并行)。

1线

$ echo“ 100000000” | 时间-p java mergeSortTest

输入n: 
[成功]

真实40.73
用户40.86
sys 0.22

2个线程

$ echo“ 100000000” | 时间-p java mergeSortTest

输入n: 
[成功]

真实26.90
用户49.65
sys 0.48

4线

$ echo“ 100000000” | 时间-p java mergeSortTest

输入n: 
[成功]

真实25.13
用户76.53
sys 0.43

使用4个线程时,CPU使用率约为80%至90%;使用2个线程时,CPU使用率约为50%;使用单线程时,CPU使用率约为25%。

我期望在4个线程中运行时可以加快速度。我在任何地方错了吗?

更新1

这是代码:http :
//pastebin.com/9hQPhCa8

更新2 我有一个Intel Core i5第二代处理器。

输出cat /proc/cpuinfo | less(仅显示核心0)。

处理器:0
vendor_id:正版英特尔
cpu家庭:6
型号:42
型号名称:Intel(R)CoreTM i5-2410M CPU @ 2.30GHz
步进:7
cpu兆赫:800.000
缓存大小:3072 KB
物理编号:0
兄弟姐妹:4
核心编号:0
cpu核心数:2
尖酸:0
初始杀虫剂:0
fdiv_bug:否
hlt_bug:否
f00f_bug:否
coma_bug:否
fpu:是的
fpu_exception:是
cpuid级别:13
wp:是的
标志:fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss hts tm pbe nx rdtscp lm constant_tsc arch_perfmon pebs tsx dxsqqtstsqpstqtsts qpstqdsts xtpr pdcm sse4_1 sse4_2 x2apic popcnt xsave avx lahf_lm ida arat epb xsaveopt pln pts dts tpr_shadow vnmi flexpriority ept vpid
bogomips:4589.60
clflush大小:64
cache_alignment:64
地址大小:物理36位,虚拟48位
能源管理:

问题答案:

Core
i5具有2个内核和超线程技术,因此似乎具有4个内核。由于您的排序算法在保持CPU繁忙方面做得很好,因此这两个额外的逻辑核心几乎无法提供比两个物理核心更多的帮助。

由于您要求提供“可信的”消息来源,因此,我将指向我读过一段时间的英特尔网站上的一篇文章:Performance-insights-to-intel-
hyper-threading-technology。特别注意以下有关“超线程的限制”的部分:

计算效率极高的应用程序。
如果处理器的执行资源已得到充分利用,那么启用英特尔®HT技术将无济于事。例如,在启用英特尔HT技术的情况下运行时,每个周期已经可以执行四条指令的代码不会提高性能,因为进程内核每个周期最多只能执行四条指令。

还要注意有关内存子系统争用的这一部分:

极高的内存带宽应用程序。
运行两个线程时,英特尔®HT技术增加了对内存子系统的需求。如果应用程序能够在禁用英特尔®HT技术的情况下利用所有内存带宽,则启用英特尔®HT技术后性能不会提高。在某些情况下,由于在这些情况下内存需求增加和/或数据缓存效应,性能可能会下降。好消息是,与采用Intel
HT技术的旧版Intel CPU相比,基于Nehalem内核,集成内存控制器和Intel®QuickPath
Interconnects的系统大大增加了可用内存带宽。

其他有趣的观点可以在《英特尔开发多线程应用程序指南》中找到。这是检测线程应用程序中的内存带宽饱和的另一个代码段:

随着越来越多的线程或进程共享有限的缓存容量和内存带宽资源,线程化应用程序的可伸缩性可能会受到限制。随着引入更多线程,内存密集型线程应用程序可能会遭受内存带宽饱和的困扰。在这种情况下,线程化应用程序将无法按预期扩展,并且可能会降低性能。



 类似资料:
  • 服务烧瓶应用程序“服务器”(懒惰加载) 环境:生产警告:这是一个开发服务器。不要在生产部署中使用它。改用生产WSGI服务器。 调试模式:打开 在http://0.0.0.0:9002/上运行(按Ctrl+C退出) 使用stat重新启动 调试器处于活动状态! 调试器PIN:314-390-242线程线程中的异常-1:Traceback(最近的调用为last):文件“/home/user/downlo

  • 问题内容: 最近,我完成了一个项目,该项目比以前需要更多的IO交互,我觉得我想超越常规库(尤其是Common IO),并解决一些更深入的IO问题。 作为一项学术测试,我决定实现一个基本的多线程HTTP下载程序。这个想法很简单:提供要下载的URL,然后代码将下载文件。为了提高下载速度,将文件分块,并同时下载每个块(使用HTTP 标头)以使用尽可能多的带宽。 我有一个可以正常工作的原型,但是正如您可能

  • 问题内容: 我正在编写Node插件,尝试从C ++工作线程调用V8函数对象时遇到问题。 我的插件基本上是启动一个C std :: thread并使用WaitForSingleOject()进入一个等待循环,这是由另一个C 应用程序(一个X- Plane插件)向共享内存中写入数据触发的。我试图让我的Node插件在发出Windows共享事件信号时唤醒,然后调用我从node应用程序注册的JavaScri

  • 我的问题是。。。为什么选择completionLock。run方法中的lock()未锁定资源。当我在系统中运行程序时。出来println(Thread.currentThread())。getName()) 我得到以下输出:Thread-1 Thread-0 Thread-0 Thread-1 NoLock ATM:130 Locked ATM:160应该是:160程序终止。 还有什么是等到完成才

  • java 都有虚拟线程了,那多线程在加虚拟线程并行岂不无敌

  • 本文向大家介绍Java多线程之多线程异常捕捉,包括了Java多线程之多线程异常捕捉的使用技巧和注意事项,需要的朋友参考一下   一:为什么要单独讲多线程的异常捕捉呢? 先看个例子:   在run中手动抛出了一个运行时异常,在main中启动线程,catch语句块中捕捉下异常,捕捉到打印一句话。运行结果如下图:   发现异常被抛到了控制台,没有打印catch块中的语句。   结论:多线程运行不能按照顺