Python多重处理模块的.join（）方法到底在做什么？

呼延晋

2023-03-14

问题内容：

从PMOTW文章中了解Python多重处理，并且希望对方法的确切作用进行一些说明。join()

在2008年的旧教程中，它指出，没有p.join()以下代码中的调用，“子进程将处于空闲状态而不会终止，成为必须手动杀死的僵尸”。

from multiprocessing import Process

def say_hello(name='world'):
    print "Hello, %s" % name

p = Process(target=say_hello)
p.start()
p.join()

我添加的打印输出PID，以及一个time.sleep测试，并就我所知道的，在自己的进程终止：

from multiprocessing import Process
import sys
import time

def say_hello(name='world'):
    print "Hello, %s" % name
    print 'Starting:', p.name, p.pid
    sys.stdout.flush()
    print 'Exiting :', p.name, p.pid
    sys.stdout.flush()
    time.sleep(20)

p = Process(target=say_hello)
p.start()
# no p.join()

20秒内：

936 ttys000    0:00.05 /Library/Frameworks/Python.framework/Versions/2.7/Reso
938 ttys000    0:00.00 /Library/Frameworks/Python.framework/Versions/2.7/Reso
947 ttys001    0:00.13 -bash

20秒后：

947 ttys001    0:00.13 -bash

行为与p.join()添加回文件末尾的行为相同。每周Python模块提供了非常易读的模块解释;
“要等到进程完成工作并退出后，请使用join（）方法。”，但看来至少OS X仍在这样做。

我也想知道该方法的名称。该.join()方法在此处串联吗？它是在连接过程的结尾吗？还是只是与Python的本地.join()方法共享一个名称？

问题答案：

join()与threading或一起使用时，该方法multiprocessing与之无关str.join()-实际上没有将任何东西串联在一起。相反，它仅表示“等待此[线程/进程]完成”。join之所以使用该名称，是因为该multiprocessing模块的API看起来类似于该threading模块的API，并且该threading模块join用于其Thread对象。join在许多html" target="_blank">编程语言中，使用该术语表示“等待线程完成”是很常见的，因此Python也采用了它。

现在，您看到有和没有调用都延迟20秒的原因join()是因为默认情况下，当主进程准备退出时，它将隐式调用join()所有正在运行的multiprocessing.Process实例。在multiprocessing文档中并未对此进行明确说明，但在“编程指南”部分中进行了提及：

还请记住，非守护进程将自动加入。

您可以通过设置覆盖此行为daemon上的标志Process来True之前，要启动的过程：

p = Process(target=say_hello)
p.daemon = True
p.start()
# Both parent and child will exit here, since the main process has completed.

如果这样做，则子进程将在主进程完成后立即终止：

守护程序

进程的守护程序标志，一个布尔值。必须在调用start（）之前进行设置。

初始值是从创建过程继承的。

进程退出时，它将尝试终止其所有守护程序子进程。

Python多重处理模块的.join（）方法到底在做什么？

相关阅读

相关文章

相关问答

相关工具

相关文档