问题：

提高Julia中的性能并获得向量的最大args

冷正信

2023-03-14

我一直在和来自Python的朱莉娅玩。我写了一些代码来解决这个难题。我在用蛮力的方法。代码在Python中运行需要一段时间（~30分钟），但在Julia中仍然需要大约3分钟。我确信这有点难看，因为我还在学习这门语言。我查看了优化器页面，在函数中输入了数据类型，并避免了全局变量。

using Primes

function mymax(state::Vector{Vector{Int64}})
    maxval,maxi,maxj=0,0,0
    for (i,row) in enumerate(state)
        for (j,val) in enumerate(row)
            if val>maxval
                maxval,maxi,maxj = val,i,j
            end
        end
    end
    return maxval,maxi,maxj
end

function neighbors(state::Vector{Vector{Int64}})
    prev,i,j = mymax(state)
    ip = Primes.isprime(prev+1)
    newstates=Vector{Vector{Vector{Int}}}()
    for (di,dj) = [(-1,0),(1,0),(0,1),(0,-1)]
        ni,nj = i+di,j+dj
        (ni<1 || nj<1 || ni>length(state) || nj>length(state[1])) && continue
        (state[ni][nj]!=0) && continue
        if field[ni][nj]==ip
            newstate=deepcopy(state)
            newstate[ni][nj]=prev+1
            push!(newstates,newstate)
        end
    end
    return newstates
end

function goal(state::Vector{Vector{Int64}})
    return sum(sum(state))==2080
end

function search(start_state::Vector{Vector{Int64}},field::Vector{Vector{Int64}})
    path = [start_state]
    level=0
    solutions = Vector{Vector{Vector{Int}}}()
    while true
        (length(path)==0) && (return solutions)
        println("***")
        println(level)
        println(length(path))
        println(mymax(path[end]))
        level+=1
        newpath = Vector{Vector{Vector{Int}}}()
        for p in path
            for n in neighbors(p)
                (goal(n)) && (push!(solutions,n))
                push!(newpath,n)
            end
        end
        path=deepcopy(newpath)
    end
end

field = [[1,0,0,0,1,0,0,0],
         [0,1,0,1,0,0,0,1],
         [1,0,0,0,0,0,1,0],
         [0,0,0,1,0,0,0,1],
         [0,0,1,1,1,0,0,0],
         [0,0,0,0,0,1,0,0],
         [1,0,0,0,1,0,1,0],
         [0,0,0,0,0,1,0,1]]

 start = [[0,0,0,0,0,0,0,0],
          [0,0,0,0,0,0,0,0],
          [0,0,0,0,0,0,0,0],
          [0,0,0,0,0,0,0,0],
          [0,0,0,2,0,0,0,0],
          [0,0,0,1,0,0,0,0],
          [0,0,0,0,0,0,0,0],
          [0,0,0,0,0,0,0,0]]

solns = search(start,field)
print("Solutions found ")
println(length(solns))
for soln in solns
    display(soln)
end

与此相关的三个问题：

肯定有更好的方法来做函数mymax。我找到了一些关于阿格马克斯的建议，但这给我带来了一个大麻烦。它似乎返回总和最大的行的位置（在我的开始变量中工作，但不是一般！）

Vector{Vector{blah blah blah是正确的数据结构吗？或者我应该使用更优化的结构吗？@time返回这个：181.230324秒（214.55m分配：31.388gib，14.44%gc时间）。这似乎是很多分配，但我不确定如何诊断这个问题？

其他加快速度的技巧和窍门。我意识到我必须打开编译模式，这很有帮助！它仍然比我编写的Python代码快得多，所以这可能只是一个很大的问题空间（将成为一个很好的Euler项目问题！）。但我怀疑像我这样的新手是否编写过任何接近优化的代码。我知道这有点模糊，但我记得大约十年前，当我学习Python并被告知矢量化时。我知道这不适用于朱莉娅，但如果知道我没有错过任何重大的东西，那就太好了。

注意：我刚刚检查过，Python版本需要30分钟才能运行。因此，朱莉娅大约有10倍的进步，这当然值得拥有！然而，如果朱莉娅能有100倍的进步，我也不会感到惊讶。

共有1个答案

穆俊哲

2023-03-14

感谢@PrzemyslawSzufel的评论。我用矩阵而不是向量的向量重新编写了代码。这只是来自python的语法问题。然后Findmax以更合理的方式运行（argmax等也是如此）。

using Primes

function neighbors(state::Matrix{Int64})
    prev,ij = findmax(state)
    ip = Primes.isprime(prev+1)
    newstates=Vector{Matrix{Int64}}()
    for dij = [CartesianIndex(-1,0),CartesianIndex(1,0),CartesianIndex(0,1),CartesianIndex(0,-1)]
        nij = ij+dij
        (nij[1]<1 || nij[2]<1 || nij[1]>size(state)[1] || nij[2]>size(state)[2]) && continue
        (state[nij]!=0) && continue
        if field[nij]==ip
            newstate=deepcopy(state)
            newstate[nij]=prev+1
            push!(newstates,newstate)
        end
    end
    return newstates
end

function goal(state::Matrix{Int64})
    return sum(state)==2080
end

function search(start_state::Matrix{Int64},field::Matrix{Int64})
    path = [start_state]
    level=0
    solutions = Vector{Matrix{Int}}()
    while true
        (length(path)==0) && (return solutions)
        println("***")
        println(level)
        println(length(path))
        println(findmax(path[end]))
        level+=1
        newpath = Vector{Matrix{Int}}()
        for p in path
            for n in neighbors(p)
                (goal(n)) && (push!(solutions,n))
                push!(newpath,n)
            end
        end
        path=deepcopy(newpath)
    end
end

field = [1 0 0 0 1 0 0 0;
         0 1 0 1 0 0 0 1;
         1 0 0 0 0 0 1 0;
         0 0 0 1 0 0 0 1;
         0 0 1 1 1 0 0 0;
         0 0 0 0 0 1 0 0;
         1 0 0 0 1 0 1 0;
         0 0 0 0 0 1 0 1]
start = [0 0 0 0 0 0 0 0;
          0 0 0 0 0 0 0 0;
          0 0 0 0 0 0 0 0;
          0 0 0 0 0 0 0 0;
          0 0 0 2 0 0 0 0;
          0 0 0 1 0 0 0 0;
          0 0 0 0 0 0 0 0;
          0 0 0 0 0 0 0 0]

solns = search(start,field)
print("Solutions found ")
println(length(solns))
for soln in solns
    display(soln)
end

这在17秒内找到了解决方案（因此，又有了10倍的改进，我们达到了我所期望的100倍python）。

运行@time搜索（开始，字段）会得到17.244326秒（58.45m分配：13.356gib，28.92%的gc时间）。

把这个答案看作是对我的发现的纪念，希望其他人会觉得它有用。如果您有更好的解决方案或更多要添加的内容，请随时添加。

类似资料：

提高最大池大小和性能

在我的ASP. net网站，我有一个连接到SQL服务器快速数据库。有时候我确实会犯很多错误，比如系统。异常：超时已过期。从池中获取连接之前的超时时间。这可能是因为所有池连接都在使用中，并且达到了最大池大小。搜索错误后，我发现可能是由于SQL Server连接未关闭。但是我已经正确地使用了SQL Server连接，并且正确地处理了它。我已使用using语句处理连接。在我的应用程序中，我在一天中的
如何获得Numpy中向量的大小？

问题内容：遵循“只有一种明显的方法”，如何在Numpy中获得向量（一维数组）的大小？上面的方法有效，但是我不敢相信自己必须指定这样一个琐碎的核心功能。问题答案：您需要的功能是。（我认为它应该作为数组的属性存在于基本numpy中-说-但很好）。您还可以根据需要输入可选的n阶范数。假设您想要1范数：等等。
Clojure性能，大向量上的大循环

我正在对大小为50,000个元素的两个向量执行基于元素的操作，并且有不满意的性能问题（几秒钟）。是否存在明显的性能问题，例如使用不同的数据结构？
前端 - 怎么提高页面中大量图表渲染的性能？

我的使用场景是需要批量绘制大量图表，不过这些图表具有一定的规律性，整行或者整列是同类型图表，有什么方式可以优化性能呢？现在问题是当滚动的时候，图表渲染跟不上，滚动交互也不流畅。
获得Mongoose的最大值

问题内容：如何在Mongoose查询中获得最大值。在SQL中很容易我想在Mongoose（node.js）中等效上述SQL代码问题答案： MongoDB支持最大/最小，但他们不建议在实际应用中使用它： min和max主要用于支持mongos（分片）过程。 http://www.mongodb.org/display/DOCS/min+and+max+Query+Specifiers 您几乎可
提高Kafka Producer的性能

我们运行在apache kafka 0.10.0. x和Spring 3. x上，不能使用Spring kafka，因为它支持Spring框架版本4. x。因此，我们使用原生的Kafka Producer API来生成消息。现在我关心的是我的制片人的表现。问题是我相信有人打电话给是真正连接到Kafka broker，然后将消息放入缓冲区，然后尝试发送，然后可能会调用。现在，KafkaProd

提高Julia中的性能并获得向量的最大args

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档