当前位置: 首页 > 面试题库 >

解释器如何解释代码?

帅彦
2023-03-14
问题内容

为简单起见,请设想这种情况,我们有一台2位计算机,它具有一对称为r1和r2的2位寄存器,并且仅适用于立即寻址。

假设位序列 00 表示 添加 到我们的CPU中。也 01 的装置将数据移动到R 1和 10组 的装置将数据移动到R2。

因此,这台计算机和一个汇编器都有一种汇编语言,其中的示例代码将像

mov r1,1
mov r2,2
add r1,r2

简而言之,当我将此代码汇编成本地语言时,文件将类似于:

0101 1010 0001

上面的12位是以下代码的本机代码:

Put decimal 1 to R1, Put decimal 2 to R2, Add the data and store in R1.

因此,这基本上就是编译代码的工作方式,对吗?

可以说有人为此架构实现了JVM。在Java中,我将编写如下代码:

int x = 1 + 2;

JVM将如何准确地解释此代码?我的意思是说最终必须将相同的位模式传递给CPU,不是吗?所有的cpu都有许多可以理解和执行的指令,毕竟它们只是一点点。可以说编译后的Java字节码如下所示:

1111 1100 1001

等等。这是否意味着解释在执行时将此代码更改为0101 1010
0001?如果是的话,它已经在本机代码中了,那么为什么要说JIT只在几次之后才启动?如果它不能完全将其转换为0101 1010
0001,那么它将做什么?它如何使cpu进行加法运算?

我的假设也许有一些错误。

我知道解释的速度很慢,编译的代码速度更快,但不具有可移植性,虚拟机可以“解释”代码,但是如何?我正在寻找“如何正确/技术地解释”。欢迎使用任何指针(例如书籍或网页),而不是答案。


问题答案:

不幸的是,您描述的CPU体系结构太局限了,无法通过所有中间步骤将其弄清楚。取而代之的是,我将编写伪C和伪x86汇编程序,希望以一种清晰的方式编写而不会非常熟悉C或x86。

编译后的JVM字节码可能看起来像这样:

ldc 0 # push first first constant (== 1)
ldc 1 # push the second constant (== 2)
iadd # pop two integers and push their sum
istore_0 # pop result and store in local variable

解释器在数组中具有(这些指令的二进制编码)这些指令,以及一个引用当前指令的索引。它还有一个常量数组,一个存储区用作堆栈,一个存储区用作局部变量。然后,解释器循环如下所示:

while (true) {
    switch(instructions[pc]) {
    case LDC:
        sp += 1; // make space for constant
        stack[sp] = constants[instructions[pc+1]];
        pc += 2; // two-byte instruction
    case IADD:
        stack[sp-1] += stack[sp]; // add to first operand
        sp -= 1; // pop other operand
        pc += 1; // one-byte instruction
    case ISTORE_0:
        locals[0] = stack[sp];
        sp -= 1; // pop
        pc += 1; // one-byte instruction
    // ... other cases ...
    }
}

C代码被编译为机器代码并运行。如您所见,它是高度动态的:每次执行该指令时,它都会检查每个字节码指令,并且所有值都会通过堆栈(即RAM)。

虽然实际的加法本身可能发生在寄存器中,但是加法周围的代码与Java到计算机的代码编译器发出的代码完全不同。这是C编译器可能将以上内容转换为(pseudo-x86)的摘录:

.ldc:
incl %esi # increment the variable pc, first half of pc += 2;
movb %ecx, program(%esi) # load byte after instruction
movl %eax, constants(,%ebx,4) # load constant from pool
incl %edi # increment sp
movl %eax, stack(,%edi,4) # write constant onto stack
incl %esi # other half of pc += 2
jmp .EndOfSwitch

.addi
movl %eax, stack(,%edi,4) # load first operand
decl %edi # sp -= 1;
addl stack(,%edi,4), %eax # add
incl %esi # pc += 1;
jmp .EndOfSwitch

您可以看到,加法运算的操作数来自内存,而不是进行硬编码,即使对于Java程序而言,它们是恒定的。那是因为 对于解释器来说
,它们不是常数。解释器将被编译一次,然后必须能够执行各种程序,而无需生成专门的代码。

JIT编译器的目的就是这样做:生成专用代码。JIT可以分析使用堆栈传输数据的方式,程序中各种常量的实际值以及执行的计算顺序,以生成更有效地执行相同操作的代码。在我们的示例程序中,它将为寄存器分配局部变量0,将常量表的访问替换为将常量移动到寄存器(movl %eax, $1)中,并将堆栈访问重定向到正确的机器寄存器。忽略通常可以完成的其他一些优化(复制传播,常量折叠和无效代码消除),最终可能会得到如下代码:

movl %ebx, $1 # ldc 0
movl %ecx, $2 # ldc 1
movl %eax, %ebx # (1/2) addi
addl %eax, %ecx # (2/2) addi
# no istore_0, local variable 0 == %eax, so we're done


 类似资料:
  • 主要内容:解释器的创建PyCharm包括解释器,以便根据需要创建具有新功能的新项目。 您可以根据需要在系统中创建虚拟环境。也可以在对话框中继承全局网站包。解释器可在Python Package Index(PyPI)上找到,并且可以使用轻松安装和访问。 解释器的创建 要创建一个解释器,总是建议在管理所需配置的情况下创建一个新项目。 看看下面的截图以便更好地理解 - 这些参数包括 - 位置 - 它描述了创建虚拟环境的参数

  • Linux/Unix的系统上,一般默认的 python 版本为 2.x,我们可以将 python3.x 安装在 /usr/local/python3 目录中。 安装完成后,我们可以将路径 /usr/local/python3/bin 添加到您的 Linux/Unix 操作系统的环境变量中,这样您就可以通过 shell 终端输入下面的命令来启动 Python3 。 $ PATH=$PATH:/us

  • 当我们编写Python代码时,我们得到的是一个包含Python代码的以.py为扩展名的文本文件。要运行代码,就需要Python解释器去执行.py文件。 由于整个Python语言从规范到解释器都是开源的,所以理论上,只要水平够高,任何人都可以编写Python解释器来执行Python代码(当然难度很大)。事实上,确实存在多种Python解释器。 CPython 当我们从Python官方网站下载并安装好

  • 当我们编写Python代码时,我们得到的是一个包含Python代码的以.py为扩展名的文本文件。要运行代码,就需要Python解释器去执行.py文件。 由于整个Python语言从规范到解释器都是开源的,所以理论上,只要水平够高,任何人都可以编写Python解释器来执行Python代码(当然难度很大)。事实上,确实存在多种Python解释器。 CPython 当我们从Python官方网站下载并安装好

  • 翻译的结果是什么?它会把高级语言变成汇编语言还是机器语言,即二进制代码? 如果是后者,这是否意味着解释语言与介绍集没有关系? 一种语言只能有一个口译员?是因为解释器不做任何优化,所以我们不需要找到更好的解释器吗?

  • 我用Xtext写了一个DSL。我想要的是执行DSL,从中获得一些好的结果。 我编写了myDslGenerator类,在xtend中实现接口IGenerator,以生成java代码,它运行良好。 我有两个问题; 解释器和代码生成器有什么区别?不都是为了执行DSL吗? 如何编写一个解释器?有没有一步一步的教程链接?我找到了许多使用xint生成代码的教程,但找不到任何用于编写解释器的教程。 谢谢你, 萨