当前位置: 首页 > 面试题库 >

如何在语法上实现JJTree

唐烨煜
2023-03-14
问题内容

我有一个任务,要使用JavaCC为讲师提供的语言制作具有语义分析的自上而下的解析器。我已经写了生产规则,没有错误。我完全陷入了如何在代码中使用JJTree的问题,而我花大量时间在互联网上搜索教程的时间也没有吸引我。只是想知道有人可以花点时间来解释如何在代码中实现JJTree吗?或者,如果某个地方有隐藏的分步教程,那将对您有很大的帮助!

如果有帮助,以下是我的一些生产规则。提前致谢!

void program() : {}
{
  (decl())* (function())* main_prog()
}

void decl() #void : {}
{
  (
    var_decl() | const_decl()
   )
}

void var_decl() #void : {}
{
  <VAR> ident_list() <COLON> type()
 (<COMMA> ident_list() <COLON> type())* <SEMIC>
}

void const_decl()  #void : {}
{
  <CONSTANT> identifier() <COLON> type() <EQUAL> expression()
 ( <COMMA> identifier() <COLON> type() <EQUAL > expression())* <SEMIC>
}

void function() #void : {}
{
  type() identifier() <LBR> param_list() <RBR>
  <CBL>
  (decl())*
  (statement() <SEMIC> )*
  returnRule() (expression() | {} )<SEMIC>
  <CBR>
}

问题答案:

使用JavaCC创建AST看起来很像创建“常规”解析器(在jj文件中定义)。如果您已有语法,那么(相对)容易:)

以下是创建AST所需的步骤:

  1. 将您的jj语法文件重命名为jjt
  2. __用 根标签 修饰 它(斜体字是我自己的术语…)
  3. 调用jjtree您的jjt语法,它将jj为您生成一个文件
  4. 调用javacc您生成的jj语法
  5. 编译生成的java源文件
  6. 测试一下

这是一个快速的分步教程,假定您使用的是MacOS或*
nix,并将javacc.jar文件与语法文件放在同一目录中,java并且javac位于系统的PATH上:

假设您的jj语法文件名为TestParser.jj,将其重命名:

mv TestParser.jj TestParser.jjt

2

现在最棘手的部分是: 装饰 语法,以便创建正确的AST结构。您可以通过在AST(或节点或生产规则(全部相同))之后添加,后跟一个标识符来 修饰
AST(或节点或生产规则)。在最初的问题中,您有很多不同的产品,这意味着您要针对不同的生产规则创建相同类型的AST:这不是您想要的。#``:``#void

如果您不 装饰 产品,则将产品名称用作节点的类型(因此,您可以删除#void):

void decl() :
{}
{
     var_decl()
  |  const_decl()
}

现在,该规则仅返回该AST var_decl()或返回的任何AST const_decl()

现在让我们看一下(简化的)var_decl规则:

void var_decl() #VAR :
{}
{
  <VAR> id() <COL> id() <EQ> expr() <SCOL>
}

void id() #ID :
{}
{
  <ID>
}

void expr() #EXPR :
{}
{
  <ID>
}

我用这种#VAR类型装饰。现在这意味着该规则将返回以下树结构:

    VAR 
   / | \
  /  |  \
ID  ID  EXPR

如您所见,终端从AST中被丢弃了!这也意味着idexpr规则会松开其<ID>终端匹配的文本。当然,这不是您想要的。对于需要使终端的内部文本保持匹配的规则,您需要.value将树的显式设置.image为匹配的终端的:

void id() #ID :
{Token t;}
{
  t=<ID> {jjtThis.value = t.image;}
}

void expr() #EXPR :
{Token t;}
{
  t=<ID> {jjtThis.value = t.image;}
}

使输入"var x : int = i;"看起来像这样:

       VAR 
        |
    .---+------.
   /    |       \
  /     |        \
ID["x"] ID["int"] EXPR["i"]

这就是您为AST创建合适的结构的方式。下面是一个小的语法,它是您自己的语法的非常简单的版本,其中包括一个main测试所有语法的小方法:

// TestParser.jjt
PARSER_BEGIN(TestParser)

public class TestParser {
  public static void main(String[] args) throws ParseException {
    TestParser parser = new TestParser(new java.io.StringReader(args[0]));
    SimpleNode root = parser.program();
    root.dump("");
  }
}

PARSER_END(TestParser)

TOKEN :
{
   < OPAR  : "(" > 
 | < CPAR  : ")" >
 | < OBR   : "{" >
 | < CBR   : "}" >
 | < COL   : ":" >
 | < SCOL  : ";" >
 | < COMMA : "," >
 | < VAR   : "var" >
 | < EQ    : "=" > 
 | < CONST : "const" >
 | < ID    : ("_" | <LETTER>) ("_" | <ALPHANUM>)* >
}

TOKEN :
{
   < #DIGIT    : ["0"-"9"] >
 | < #LETTER   : ["a"-"z","A"-"Z"] >
 | < #ALPHANUM : <LETTER> | <DIGIT> >
}

SKIP : { " " | "\t" | "\r" | "\n" }

SimpleNode program() #PROGRAM :
{}
{
  (decl())* (function())* <EOF> {return jjtThis;}
}

void decl() :
{}
{
     var_decl()
  |  const_decl()
}

void var_decl() #VAR :
{}
{
  <VAR> id() <COL> id() <EQ> expr() <SCOL>
}

void const_decl() #CONST :
{}
{
  <CONST> id() <COL> id() <EQ> expr() <SCOL>
}


void function() #FUNCTION :
{}
{
  type() id() <OPAR> params() <CPAR> <OBR> /* ... */ <CBR>
}

void type() #TYPE :
{Token t;}
{
  t=<ID> {jjtThis.value = t.image;}
}

void id() #ID :
{Token t;}
{
  t=<ID> {jjtThis.value = t.image;}
}

void params() #PARAMS :
{}
{
  (param() (<COMMA> param())*)?
}

void param() #PARAM :
{Token t;}
{
  t=<ID> {jjtThis.value = t.image;}
}

void expr() #EXPR :
{Token t;}
{
  t=<ID> {jjtThis.value = t.image;}
}

3

jjtree该类(包含在中javacc.jarjj为您创建一个文件:

java -cp javacc.jar jjtree TestParser.jjt

4

上一步已创建文件TestParser.jj(如果一切正常)。让javacc(也存在于中javacc.jar)对其进行处理:

java -cp javacc.jar javacc TestParser.jj

5

要编译所有源文件,请执行以下操作:

javac -cp .:javacc.jar *.java

(在Windows上,做的:javac -cp .;javacc.jar *.java

6

关键时刻已经到来:让我们看看一切是否真的有效!要让解析器处理输入:

var n : int = I;

const x : bool = B;

double f(a,b,c) 
{ 
}

执行以下命令:

java -cp . TestParser "var n : int = I; const x : bool = B; double f(a,b,c) { }"

并且应该在控制台上看到以下内容:

程序
 删除
  VAR
   ID
   ID
   EXPR
 删除
  CONST
   ID
   ID
   EXPR
 功能
  类型
  ID
  参数
   参数
   参数
   参数

请注意,您看不到ID匹配的文本,但请相信我,它们在那里。该方法dump()只是不显示它。

高温超导

编辑

对于包含表达式的有效语法,您可以看一下我的以下表达式评估器:https://github.com/bkiers/Curta(语法在中src/grammar)。您可能想看看在二进制表达式的情况下如何创建根节点。



 类似资料:
  • 我正在尝试使用Perl6语法实现Markdown解析器,但被块引号卡住了。块引号段落不能用嵌套大括号表示,因为它是一个特定格式行的列表。但从语义上讲,它是一个嵌套的标记。 基本上可以归结为以下定义: mdBQLine令牌的实际实现与此无关。唯一需要注意的是,mdBQLineBody键包含实际引用的带有

  • 我现在正在学习,出于好奇,我想问以下问题。 在此之前,我已经阅读了以下文档和线程。 https://beam.apache.org/documentation/programming-guide/#applying-转变 解释ApacheBeamPython语法 我知道管道()是java的Python版本。然而,我很想知道python是如何将运算符解释为处理器,处理从左到右的每个pCollecti

  • 问题内容: 是否有任何可用于实现列表分页的库? 假设我有10行的空间,并且用户可以选择是否要按页面向前或向后滚动(因此+-10个项目)。这可能例如由来控制。 要构建一个类,以防止在没有足够的项目可显示时向后/向前滚动,以及自我保存用户当前在哪个页面上的状态,这可能是一项艰巨的工作。 那有什么事吗 问题答案: 我之前已经解决了。我做了一个静态的getPages方法,该方法将通用集合分解为页面列表(也

  • 我正在做一个项目,我们有很多实体,我们将在这些实体上进行CRUD操作。我创建了一个基本实体类,在所有其他实体中,我扩展了基本实体类,该类具有诸如created\u date、created\u by、last\u updated\u date、last\u updated\u by等公共字段。现在,我想在Spring CrudRepository方法上实现aspect,并在保存时设置上述字段。 我

  • 我们的初创公司是使用Firebase和Google Cloud的“云原生”。我们正在研究事件驱动设计,但是我很难将这个概念与Firebase或GCP上的特定服务相匹配。 例如:用户通过移动应用程序创建合同草案(Firestore文档)。我们需要触发以下操作: 通过电子邮件和推送通知通知合同中的其他用户 写入通知表,以便用户在应用程序中有一个“收件箱”,并将其标记为已读或已删除 生成一个将在一个月内

  • 你好,我想构建一个应用程序,我的android应用程序可以识别我的语音命令