“中文编程”知乎专栏原文

此文涉及的源码版本: program-in-chinese/quan2

声明 代码来源 How to Create Language Using Antlr4

本作主要作为学习Antlr, 以及实践中文命名之用. 目标不是一个实用的编程语言.

个人感觉这样可以比较容易的用原型来尝试和演示不同语法设计, 如果有更简单的途径请不吝赐教. 欢迎各种自行修改~碰到任何问题也欢迎一同探讨.

下面是”圈2”语言的示例代码:

开始
    使 甲 为 5
    使 乙 为 10
    加 3 到 乙
    加 乙 到 甲
    加 甲 到 乙
    打印 乙
    打印 3
结束

附上需要自行编写的三个文件: Antlr4的语法定义文件:

按照README说明, Antlr可以据此自动生成四个分析器相关类文件. T前缀是由于Antlr约定大写开头是Token定义. 标识符支持中文.

grammar 圈2;
程序   : '开始' 声明+ '结束';
          
声明 : 赋值 | 加 | 打印 ;

赋值    : '使' T标识符 '为' (T数 | T标识符) ;
打印     : '打印' (T数 | T标识符) ;
加       : '加' (T数 | T标识符) '到' T标识符 ;

T标识符     : ('a' .. 'z' | 'A' .. 'Z' | '\u4E00'..'\u9FA5' | '\uF900'..'\uFA2D')+ ;
T数 : [0-9]+ ;
T空白     : [ \n\t]+ -> skip;

定制监听器:

通过对每种语句分析后进行对应处理, 实质上起了解释器的作用.

public class 定制监听器 extends 2BaseListener {

  private Map<String, Integer> 变量表;

  public 定制监听器() {
    变量表 = new HashMap<>();
  }

  @Override
  public void exit赋值(赋值Context 上下文) {
    // 赋值语句分析结束时运行此方法

    String 变量名 = 上下文.T标识符(0).getText();

    // 如果语句中有两个变量(标识符), 那么取第二个变量的值, 否则取数的值
    int  = 上下文.T标识符().size() > 1
        ? 变量表.get(上下文.T标识符(1).getText())
        : Integer.parseInt(上下文.T().getText());

    // 更新变量值
    变量表.put(变量名, );
  }

  @Override
  public void exit(Context 上下文) {
    // 加语句分析结束时运行此方法

    String 变量名 = 上下文.T标识符().size() > 1 ? 上下文.T标识符(1).getText() : 上下文.T标识符(0).getText();
    int 添加值 = 上下文.T标识符().size() > 1 ? 变量表.get(上下文.T标识符(0).getText())
        : Integer.parseInt(上下文.T().getText());

    变量表.put(变量名, 变量表.get(变量名) + 添加值);
  }

  @Override
  public void exit打印(打印Context 上下文) {
    // 打印语句分析结束时运行此方法

    String 输出 = 上下文.T标识符() == null ? 上下文.T().getText() : 变量表.get(上下文.T标识符().getText()).toString();
    System.out.println(输出);
  }
}

运行器:

读取文件输入, 调用附着了定制监听器的分析器

public class 运行器 {
  public static void main(String[] 参数) {
    try {
      ANTLRInputStream 输入 = new ANTLRInputStream(new FileInputStream(参数[0]));

      2Lexer 词法分析器 = new 2Lexer(输入);
      2Parser 语法分析器 = new 2Parser(new CommonTokenStream(词法分析器));
      语法分析器.addParseListener(new 定制监听器());

      // 开始分析
      语法分析器.程序();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}

尚未探索如何用Antlr4实现无空格语法设计(不允许标识符中出现关键字应该可以做到, 但那样限制太多)