当前位置: 首页 > 编程笔记 >

基于python的多进程共享变量正确打开方式

朱建弼
2023-03-14
本文向大家介绍基于python的多进程共享变量正确打开方式,包括了基于python的多进程共享变量正确打开方式的使用技巧和注意事项,需要的朋友参考一下

多进程共享变量和获得结果

由于工程需求,要使用多线程来跑一个程序。但是因为听说python的多线程是假的,于是使用多进程,反正任务需要共享的参数少。

查阅资料,发现实现多进程主要使用Multiprocessing,有两种方式,一种是Process,另一种是Pool。

p = Process(target=fun,args=(args))

再通过p.start()来启动一个子进程,通过p.join()方法来使得子进程运行结束后再执行父进程。

但是这样很烦,还要写个for 循环来开n个线程和join。

于是推荐用Pool。它可以开一个固定大小的进程池,然后每个线程执行apply_async()函数调用要执行的函数,最后再close和join。

代码如下:

pathm=Manager().Queue(len(pathlist))
for d in pathlist:
 pathm.put(d)
p=Pool(cp.threads)
results=[]
for i in range(cp.threads):
 temp=p.apply_async(ProcessWorker,args=(i,pathm,cp))
 results.append(temp)
print 'Waiting for all subprocesses done...'
p.close()
p.join()
print 'All subprocesses finish Processing.'
results=[r.get() for r in results]

上面的代码演示了如何使用pool多进程,如何在Pool里的进程之间共享变量pathm,以及如何获得进程函数执行的结果。需要注意的是,ProcessWorker必须是个无界的函数,否则报错该函数无法被pickle从而不能分配到各个进程。

cPickle.PicklingError: Can't pickle <type 'instancemethod'>: attribute lookup __builtin__.instancemethod failed

有界函数和python的多进程机制

从上面引申到了一个概念,就是有界函数无界函数的概念。

查阅资料之后我总结如下:

有界函数是包在一个类中,并且只有当类被实例化之后才能使用的函数,它的界就是这个实例。我们常常把这些函数称为类方法。例如以self为参数的类方法。

无界函数可以是没有被包在类中的函数,也可以是类中的静态方法,它们跟类是独立的。如类中的静态方法,它即使在某个类中被定义,但是不能访问类中的参数和其他方法。

python多进程的机制应该是把每个进程要调用的方法和传入的参数(如上面例子中的ProcessWorker)编译然后打包,然后复制到每个进程中执行。如果输入的是一个有界函数,那么它的参数应该是它所属的类(包括参数和方法),但是这是无法获得的,而且类属性和方法可能会有坑,导致难以打包。所以python限定了多进程要调用的函数不能是类方法。

我们要把多进程调用的函数放到类外面,或者变成静态函数。但是静态函数的话不能被所属的类的方法调用(self.ProcessWorker的形式),需要在外部调用,如mc=MyClass(),mc.ProcessWorker来调用,或者MyClass().ProcessWorker来调用。

以上这篇基于python的多进程共享变量正确打开方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。

 类似资料:
  • 本文向大家介绍基于Python log 的正确打开方式,包括了基于Python log 的正确打开方式的使用技巧和注意事项,需要的朋友参考一下 保存代码到文件:logger.py 使用方法: 以上这篇基于Python log 的正确打开方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持呐喊教程。

  • Python 3.1.2 我对多处理产生的两个线程之间的变量共享有问题。过程这是一个简单的bool变量,它应该决定线程是应该运行还是应该停止执行。下面是三种情况下显示的简化代码(但使用与我的原始代码相同的机制): 主要用于Thread加工。Thread类型和自紧度。正在运行布尔类型[工作正常] 我想了解的是为什么它是这样工作的,而不是另一种。(即,为什么第2点没有像我认为的那样起作用)。 测试是从

  • 问题内容: 第一个问题是Value和Manager()。Value有什么区别? 其次,是否可以不使用Value共享整数变量?下面是我的示例代码。我想要的是获取一个整数值而不是Value的字典。我所做的就是在此过程之后全部更改。有没有更简单的方法? 问题答案: 使用时,您会在共享内存中获得一个对象,默认情况下,该对象使用进行同步。使用该对象时,您将得到一个控制服务器进程的对象,该服务器进程允许对象值

  • 前一章我们介绍了一些使用goroutine和channel这样直接而自然的方式来实现并发的方法。然而这样做我们实际上回避了在写并发代码时必须处理的一些重要而且细微的问题。 在本章中,我们会细致地了解并发机制。尤其是在多goroutine之间的共享变量,并发问题的分析手段,以及解决这些问题的基本模式。最后我们会解释goroutine和操作系统线程之间的技术上的一些区别。

  • 问题内容: 我正在Python中进行多处理实验,并试图在两个进程之间共享一个字符串数组。这是我的python代码: 运行脚本时,我看到该脚本已正确填充,并且可在中找到,但不能在中找到。结果如下: 我忽略了什么吗? 预先感谢您的反馈。:) 问题答案: 我的猜测是: 存储3个指针。将它们分配给当前进程之外没有意义的内存地址。尝试访问此时包含垃圾邮件的无意义地址。 分配对所有过程都有意义的值似乎有帮助:

  • 你可以在怎么使用变量中所描述的方式来创建,初始化,保存及加载单一的变量.但是当创建复杂的模块时,通常你需要共享大量变量集并且如果你还想在同一个地方初始化这所有的变量,我们又该怎么做呢.本教程就是演示如何使用tf.variable_scope() 和tf.get_variable()两个方法来实现这一点. 问题 假设你为图片过滤器创建了一个简单的模块,和我们的卷积神经网络教程模块相似,但是这里包括两