当前位置: 首页 > 知识库问答 >
问题:

为什么Visual C自动矢量器不能对这个简单的循环进行矢量化?

孔建柏
2023-03-14

我不明白为什么Visual C不能自动矢量化这个循环......有什么想法吗?

我得到:

testvec.cpp:12: info C5002: loop not vectorized due to reason '1200'

其中,原因代码1200为:

循环包含阻止矢量化的循环携带的数据依赖项。循环的不同迭代相互干扰,这样对循环进行矢量化将产生错误的答案,而自动矢量器无法向自己证明不存在此类数据依赖关系。

但为什么呢?

#include <stdlib.h>

int main(int argc, char *argv[])
{
    int const n = argc;
    double
        *const p1 = (double *)malloc(n * n * sizeof(*p1)),
        *const p2 = (double *)malloc(n * n * sizeof(*p2));
    for (int j = 0; j < n; ++j)
    {
        double const sj = p1[n * j];
        for (int i = 0; i < n; ++i)
        {
            double const sum = p1[i] + sj, old = p1[i + n * j];
            p2[i + n * j] = sum < old ? sum : old;
        }
    }
}

共有1个答案

魏冷勋
2023-03-14

我终于找到了如何修复它...似乎n*j中的乘法是罪魁祸首。
将其提升到int nj=n*j;并在内部循环中使用nj代替修复问题。

我仍然不知道为什么会这样。

如果有人知道,请贴出来!

 类似资料:
  • 我试图找到一个简洁的例子,它显示了x86-64系统上java中的自动矢量化。 我在for循环中使用y[I]=y[I]x[I]实现了以下代码。这段代码可以从自动矢量化中受益,所以我认为java应该在运行时使用SSE或AVX指令编译它,以加快速度<但是,我在生成的本机代码中找不到矢量化的指令。 VecOpMicroBenchmark。java应该受益于自动矢量化: 为了了解它是否得到矢量化,我执行了以

  • 矢量或者说向量,可以通过2~4个分量表示一个向量,比如通过vec3(1,0,0)表示三维空间中一个沿着x轴正方向的三维方向向量,如果你有高中数学的基础,应该对向量有一定的了解,对于三维坐标的相关几何运算也有一定的概念。 关键字 数据类型 vec2 二维向量,具有xy两个分量,分量是浮点数 vec3 三维向量 ,具有xyz三个分量,分量是浮点数 vec4 四维向量 ,具有xyzw四个分量,分量是浮点

  • 问题 很长一段时间以来,我的印象是使用嵌套的

  • Vector是由连续整数索引的值的集合。 使用Clojure中的矢量方法创建矢量。 例子 (Example) 以下是在Clojure中创建矢量的示例。 (ns clojure.examples.example (:require [clojure.set :as set]) (:gen-class)) (defn example [] (println (vector 1 2 3

  • 新的RyuJIT编译器是否生成过向量(SIMD)CPU指令,以及何时生成? 旁注:系统。Numerics命名空间包含允许显式使用向量操作的类型,向量操作可能生成也可能不生成SIMD指令,具体取决于CPU、CLR版本、JITer版本,无论是否直接编译为本机代码。这个问题具体是关于非矢量代码(例如C或F中的)何时会生成SIMD指令。

  • 结构体定义、常量和构造函数 定义: typedef struct cpVect{ cpFloat x, y; } cpVect 零向量常量: static const cpVect cpvzero = {0.0f,0.0f}; 创建新结构体所用的便捷的构造函数: cpVect cpv(const cpFloat x, const cpFloat y)