当前位置: 首页 > 面试题库 >

Python 2.7:如何弥补pool.starmap的缺失?

步衡
2023-03-14
问题内容

我已经定义了这个功能

def writeonfiles(a,seed):
    random.seed(seed)

    f = open(a, "w+")
    for i in range(0,10):
        j = random.randint(0,10)
        #print j
        f.write(j)
    f.close()

其中a是包含文件路径的字符串,种子是整数种子。我想以这样一种方式并行化一个简单的程序,即每个内核采用我提供的可用路径之一,播种其随机生成器,然后在该文件上写入一些随机数,例如,如果我传递矢量

vector = [Test/file1.txt, Test/file2.txt]

和种子

seeds = (123412, 989898),

它给第一个可用的核心功能

writeonfiles(Test/file1.txt, 123412)

第二个是具有不同参数的相同函数:

writeonfiles(Test/file2.txt, 989898)

我在Stackoverflow上浏览了很多类似的问题,但是我无法解决任何问题。我试过的是:

def writeonfiles_unpack(args):
    return writeonfiles(*args)
if __name__ == "__main__":
     folder = ["Test/%d.csv" %i for i in range(0,4)]
     seed = [234124, 663123, 12345 ,123833]
     p = multiprocessing.Pool()
     p.map(writeonfiles, (folder,seed))

并给我TypeError:writeonfiles()恰好接受2个参数(给定1个)。

我也尝试过

if __name__ == "__main__":
    folder = ["Test/%d.csv" %i for i in range(0,4)]
    seed = [234124, 663123, 12345 ,123833]
    p = multiprocessing.Process(target=writeonfiles, args= [folder,seed])
    p.start()

但这给了我
种子super(Random,self).seed(a)TypeError:unhashable type:’list’的文件
/usr/lib/python2.7/random.py”,行120

最后,我尝试了contextmanager

 @contextmanager
 def poolcontext(*args, **kwargs):
     pool = multiprocessing.Pool(*args, **kwargs)
     yield pool
     pool.terminate()

if __name__ == "__main__":
    folder = ["Test/%d" %i for i in range(0,4)]
    seed = [234124, 663123, 12345 ,123833]
    a = zip(folder, seed)
    with poolcontext(processes = 3) as pool:
    results = pool.map(writeonfiles_unpack,a )

并导致文件“ /usr/lib/python2.7/multiprocessing/pool.py”的第572行中的get提高self._value

TypeError:“模块”对象不可调用


问题答案:

Python 2.7缺少starmapPython
3.3+中的合并方法。您可以通过使用包装器装饰目标函数来克服此问题,该包装器将对参数元组进行解包并调用目标函数:

import os
from multiprocessing import Pool
import random
from functools import wraps


def unpack(func):
    @wraps(func)
    def wrapper(arg_tuple):
        return func(*arg_tuple)
    return wrapper

@unpack
def write_on_files(a, seed):
    random.seed(seed)
    print("%d opening file %s" % (os.getpid(), a))  # simulate
    for _ in range(10):
        j = random.randint(0, 10)
       print("%d writing %d to file %s" % (os.getpid(), j, a))  # simulate


if __name__ == '__main__':

    folder = ["Test/%d.csv" % i for i in range(0, 4)]
    seed = [234124, 663123, 12345, 123833]

    arguments = zip(folder, seed)

    pool = Pool(4)
    pool.map(write_on_files, iterable=arguments)
    pool.close()
    pool.join()


 类似资料:
  • 初入行测试,测试点提取的角度考虑不全面怎么办? 比如web测试和接口测试,刚开始只学习过网络中的项目(没做过公司实际项目),只是知道有一个大概的提取思路,但是还有一些角度可能考虑不到,大家在公司一般是怎么做的呢? 希望知道的小伙伴解答一下,十分感谢!!!

  • 我成功地在我的应用程序中实现了一个导航抽屉,将菜单的每个项目链接到一个片段。目标片段隐藏抽屉切换并显示向上按钮(即箭头图标),但无论出于何种原因,如果我单击它,它会打开抽屉,我无法返回到上一个片段。我必须按后退按钮才能做这件事。我该如何改变这种行为?不在每个片段中添加代码就可以解决这个问题吗? 我使用的内容: 导航组件 主要活动 完整存储库:Github

  • 本文向大家介绍如何解决RNN梯度消失和弥散的情况?相关面试题,主要包含被问及如何解决RNN梯度消失和弥散的情况?时的应答技巧和注意事项,需要的朋友参考一下 为了解决梯度爆炸问题,Thomas Mikolov首先提出了一个简单的启发性的解决方案,就是当梯度大于一定阈值的的时候,将它截断为一个较小的数。具体如算法1所述: 算法:当梯度爆炸时截断梯度(伪代码) 下图可视化了梯度截断的效果。它展示了一个小

  • 我有一个单列PySpark数据框。 我想使用像熊猫ffill()函数一样的前向填充来计算缺失值。 期望输出 免责声明:我在stackoverflow中有一些解决方案,但当您只有一列作为输入时,它们就不起作用了。

  • 问题内容: 如何使用python2.7获取公共IP?不是私有IP。 问题答案: 当前有几种选择: ip.42.pl jsonip.com httpbin.org ipify.org 以下是可以利用上述每种方法的确切方法。 ip.42.pl 这是我找到的第一个选项。对于脚本来说非常方便,您不需要在这里进行JSON解析。 jsonip.com 似乎该域的唯一目的是返回JSON中的IP地址。 httpb

  • 本文向大家介绍如何解决RNN梯度爆炸和弥散的问题?相关面试题,主要包含被问及如何解决RNN梯度爆炸和弥散的问题?时的应答技巧和注意事项,需要的朋友参考一下 答:梯度爆炸:为解决梯度爆炸问题,Thomas Mikolov首先提出了一个简单的启发性的解决方案,就是当梯度大于一定阀值的时候,将它截断为一个较为小的数。 解决梯度弥散问题的两种方法: 第一种:将随机初始化W改为一个有关联的矩阵初始化。 第二