问题：

MSVC内联ASM到GCC

水昊阳

2023-03-14

我正在尝试同时处理MSVC和GCC编译器，同时更新这个代码库以在GCC上工作。但我不确定GCCs内联ASM是如何工作的。现在我并不擅长将ASM转换为C，否则我就会使用C而不是ASM。

SLONG Div16(signed long a, signed long b)
{
    signed long v;
#ifdef __GNUC__ // GCC doesnt work.
__asm() {
#else // MSVC
__asm {
#endif
        mov edx, a
        mov ebx, b          
        mov eax, edx           
        shl eax, 16          
        sar edx, 16            
        idiv ebx              
        mov v, eax              
    }
    return v;
}

signed long ROR13(signed long val)
{
    _asm{ 
        ror val, 13
    }
}

我假设ROR13的工作方式类似于(val<<13)(val>>(32-13))，但代码不会产生相同的输出。

什么是将这个内联ASM翻译成GCC的正确方法，或者这个代码的C翻译是什么？

容修贤

2023-03-14

GCC使用与MSVC完全不同的语法进行内联组装，因此维护这两种表单需要相当多的工作。这也不是个特别好的主意。内联装配有很多问题。人们经常使用它，因为他们认为它会使他们的代码运行得更快，但它通常有相反的效果。除非您是汇编语言和编译器代码生成策略的专家，否则最好让编译器的优化器生成代码。

但是，当您尝试这样做时，您必须在这里稍微小心一点：带符号的右移位是在C中实现定义的，所以如果您关心可移植性，您需要将值转换为等效的无符号类型：

#include <limits.h>   // for CHAR_BIT

signed long ROR13(signed long val)
{
    return ((unsigned long)val >> 13) |
           ((unsigned long)val << ((sizeof(val) * CHAR_BIT) - 13));
}

（另请参见C++中循环移位（旋转）操作的最佳实践）。

signed long Div16(signed long a, signed long b)
{
    return ((long long)a << 16) / b;
}

在可以进行本机64位除法的64位架构上，（假设long仍然是像Windows上一样的32位类型）这将转换为：

movsxd  rax, a   # sign-extend from 32 to 64, if long wasn't already 64-bit
shl     rax, 16
cqo              # sign-extend rax into rdx:rax
movsxd  rcx, b
idiv    rcx      # or  idiv b  if the inputs were already 64-bit
ret

不幸的是，在32位x86上，代码并没有那么好。编译器会向内部库函数发出一个调用，该函数提供扩展的64位除法，因为编译器无法证明使用单个64B/32B=>32Bidiv指令不会出错。（如果商数不适合eax,则会引发#de异常,而不是截断）

换句话说，转换：

int32_t Divide(int64_t a, int32_t b)
{
    return (a / b);
}

mov   eax, a_low
mov   edx, a_high
idiv  b                 # will fault if a/b is outside [-2^32, 2^32-1]
ret

所以，你会变得丑陋。看起来是这样的：

signed long Div16(signed long a, signed long b)
{
#ifdef __GNUC__     // A GNU-style compiler (e.g., GCC, Clang, etc.)
    signed long quotient;
    signed long remainder;  // (unused, but necessary to signal clobbering)
    __asm__("idivl  %[divisor]"
           :          "=a"  (quotient),
                      "=d"  (remainder)
           :           "0"  ((unsigned long)a << 16),
                       "1"  (a >> 16),
             [divisor] "rm" (b)
           : 
           );
    return quotient;
#elif _MSC_VER      // A Microsoft-style compiler (i.e., MSVC)
    __asm
    {
        mov  eax, DWORD PTR [a]
        mov  edx, eax
        shl  eax, 16
        sar  edx, 16
        idiv DWORD PTR [b]
        // leave result in EAX, where it will be returned
    }
#else
    #error "Unsupported compiler"
#endif
}

这将在Microsoft和GNU风格的编译器上产生所需的输出。

嗯，多半是。由于某种原因，当您使用rm约束时，编译器可以自由地选择是将除数作为内存操作数处理还是将其加载到寄存器中，Clang生成的目标代码比仅使用r（强制将其加载到寄存器中）更差。这不会影响GCC或ICC。如果您关心Clang的输出质量，您可能只想使用r，因为这将在所有编译器上提供同样好的目标代码。

（注意：GCC在输出中使用sal助记符，而不是shl助记符。这是相同的指令--差异只对右移位有影响--而且所有正常的汇编程序员都使用shl。我不知道为什么GCC发出sal，但您可以将其精神转换为shl。）

MSVC内联ASM到GCC

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档