当前位置: 首页 > 面试题库 >

利用并发对函数进行向量化

陈允晨
2023-03-14
问题内容

对于简单的神经网络,我想将一个函数应用于gonum的所有值VecDense

Gonum有一个Apply用于密集矩阵的方法,但没有用于向量的方法,因此我是手工完成的:

func sigmoid(z float64) float64 {                                           
    return 1.0 / (1.0 + math.Exp(-z))
}

func vSigmoid(zs *mat.VecDense) {
    for i := 0; i < zs.Len(); i++ {
        zs.SetVec(i, sigmoid(zs.AtVec(i)))
    }
}

这似乎是并发执行的明显目标,所以我尝试了

var wg sync.WaitGroup

func sigmoid(z float64) float64 {                                           
    wg.Done()
    return 1.0 / (1.0 + math.Exp(-z))
}

func vSigmoid(zs *mat.VecDense) {
    for i := 0; i < zs.Len(); i++ {
        wg.Add(1)
        go zs.SetVec(i, sigmoid(zs.AtVec(i)))
    }
    wg.Wait()
}

这不起作用,也许不是意外的,因为Sigmoid()它没有以结尾wg.Done(),因为return语句(完成所有工作)紧随其后。

我的问题是:如何使用并发将函数应用于gonum向量的每个元素?


问题答案:

首先请注意,这种并发计算的尝试假定SetVec()and
AtVec()方法对于与不同索引并发使用是安全的。如果不是这种情况,则尝试的解决方案本质上是不安全的,并可能导致数据争用和不确定的行为。

wg.Done()应该被调用以表明“工人” goroutine已完成其工作。但是 只有 在goroutine完成工作 时才 可以。

在您的情况下,不是(仅)sigmoid()在工作程序goroutine中运行的功能,而是zs.SetVec()。因此,您应该wg.Done()zs.SetVec()退货后立即致电。

一种方法是wg.Done()SetVec()方法的末尾添加a (也可以defer wg.Done()在其开始处添加a
),但是引入这种依赖关系是不可行的(SetVec()不应该知道任何等待组和goroutine,这会严重限制其可用性)。

在这种情况下,最简单,最干净的方法是启动一个匿名函数(函数文字)作为工作程序goroutine,您可以在其中调用zs.SetVec(),并且在wg.Defer()上述函数返回后可以在其中调用。

像这样:

for i := 0; i < zs.Len(); i++ {
    wg.Add(1)
    go func() {
        zs.SetVec(i, sigmoid(zs.AtVec(i)))
        wg.Done()
    }()
}
wg.Wait()

但仅有这 将不 工作,作为函数字面(关闭)指的是同时修改,因此该功能的文字应该有自己的副本,比如工作循环变量

for i := 0; i < zs.Len(); i++ {
    wg.Add(1)
    go func(i int) {
        zs.SetVec(i, sigmoid(zs.AtVec(i)))
        wg.Done()
    }(i)
}
wg.Wait()

还要注意,goroutines(尽管可能是轻量级的)确实有开销。如果他们所做的工作“很小”,那么开销可能会超过利用多个内核/线程的性能收益,并且总体而言,您可能无法通过同时执行此类小任务来获得性能(地狱,甚至比不使用goroutines做得更糟)
。测量。

另外,您正在使用goroutine来完成最少的工作,可以通过在完成它们的“微小”工作后不“扔掉”
goroutine来提高性能,但是您可以“重用”它们。



 类似资料:
  • 问题内容: 我在向量的Java API中找不到任何排序功能。 仅用于而不是用于。 我不想编写自己的排序功能,因为我认为Java应该实现此功能。 我正在寻找类似的东西: 问题答案: 根据API文档,仅实现,所以我不预见问题。可能是因为您按照旧的Java 1.0样式声明了才引起您的困惑: 而不是在接口之前声明它(这是一种好习惯): 因此,您可以利用来对集合进行排序,定义默认的订购行为和/或定义外部可控

  • 我运行的是opencv 2.4.2C++。 我试图用OpenCV来识别人。 我正在使用VidTIMIT数据集,该数据集包含不同方向的不同人员。 我在用CvSVM对这些人进行分类。 我的问题是SVM的输出总是一样的。 我遵循的算法是: 基于Haar的人脸检测 调整面的大小(58*58) 支持向量机训练 分类 现在,我在想我是不是在训练中做错了什么。 我正在尝试这个方法,考虑5个(num_name)人

  • 大家好,我在Anylogic process Modeling Library中创建了一个关于公共汽车终点站的模型。有两个源块,一个关于乘客,将根据数据库表获得他们的到达率,另一个关于公共汽车到达率的源块。它们都将在一个被赋予旅行时间的汇编器块上组合。现在汇编器块需要两个输入量。第一个是关于总线的数量,给它赋值1。二是根据数据库的数据,对乘客的价值在不断变化的情况进行分析。如何分配在队列中等待的乘

  • 本文向大家介绍利用Fn.py库在Python中进行函数式编程,包括了利用Fn.py库在Python中进行函数式编程的使用技巧和注意事项,需要的朋友参考一下 尽管Python事实上并不是一门纯函数式编程语言,但它本身是一门多范型语言,并给了你足够的自由利用函数式编程的便利。函数式风格有着各种理论与实际上的好处(你可以在Python的文档中找到这个列表):     形式上可证     模块性    

  • 问题内容: 是否可以使用排序数组,然后再将另一个相关数组定位为与排序数组相同,例如: 从这一点出发,我想对数组进行排序,这样,如果“人”有一个cellNo“ x”,则在对数组进行排序后,他将具有相同的“ cellNo”“ x” 问题答案: 我会采用另一种方法: 创建一个新对象: 创建一个比较器: 打电话一对阵列

  • 问题内容: 我已经找到了一种使代码按我希望的方式运行的方法,但是我想了解为什么它如此运行,以便提高对Go并发性的理解。 我正在测试以等待一些goroutine完成,因为我计划以这种方式多次上传到Amazon S3。 这是我最初的代码: 我很惊讶地看到输出是:。 取而代之的是这样的:。 由于循环甚至没有达到6,这对我来说毫无意义。后来我将该变量作为参数传递给匿名函数,然后按预期运行。 为什么会这样?