Antlr入门详细教程

发表于:2007-06-22来源:作者:点击数: 标签:
一、 Antlr 的主要类: Antlr 中有主要类有两种(其实还有一种 TreeLexer ) Lexer: 文法分析器类。主要用于把读入的字节流根据规则分段。既把长面条根据你要的尺寸切成一段一段:)并不对其作任何修改。 Parser: 解析器类。主要用于处理经过 Lexer 处理后

   
  一、 Antlr 的主要类:
  
  Antlr 中有主要类有两种(其实还有一种 TreeLexer )
  
  Lexer: 文法分析器类。主要用于把读入的字节流根据规则分段。既把长面条根据你要的尺寸切成一段一段:)并不对其作任何修改。

  
  Parser: 解析器类。主要用于处理经过 Lexer 处理后的各段。一些具体的操作都在这里。
 
  二、 Antlr 文法文件形式:
  
  Antlr 文件是 *.g 形式,即以 g 为后缀名。
  
  例如: t.g
  
  class P extends Parser;
 
  startRule
  
  :   n:NAME
 
  {System.out.println("Hi there, "+n.getText());}
 
  ;
 
  class L extends Lexer;
  
  // one-or-more letters followed by a newline
 
  NAME:   ( 'a'……'z'|'A'……'Z' )+ NEWLINE
 
  ;
 
  NEWLINE
 
  :   '\r' '\n'   // DOS
  
  |   '\n'        // UNIX
 
  ;
  
  
  具体成分分析:
 
  1 、总体结构
 
  
  Class P extends Parser
 
  Class L extends Lexer
 
  两行同 JAVA 继承一样, P 继承 Parser 类; L 继承 Lexer 类。每个 .g 文件只能各有一个。

  2 、 Lexer 类分析
 
  一般按照
 
  类型名:匹配的具体规则;
 
  的形式构成。是分隔字节流的依据。同时可以看到里面可以互相引用。如本例中的类型名 NEWLINE 出现在 NEW 的匹配规则中。
 
  3 、 Parser 类分析
 
  一般按照
 
  起始规则名:
 
  规则实例名:类型名或规则名
 
  {Java 语句……; }
 
  
  ;

  ……
 
  的形式构成。
 起始规则名:任意。
 
  规则实例名:就象 Java 中“ String s ;”的 s 一样。规则实例名用于在之后的 JAVA 语句中调用。
 
  类型名或规则名:可以是在 Lexer 中定义的类型名,也可以是 Parser 中定义的规则名。感觉就像是 int 与 Integer 的区别。
 
  Java 语句:指当满足当前规则时所执行的语句。 Antlr 会自动嵌入生成的 java 类中。

  三、生成 Java 类
 
  1 、从 www.antlr.org 上下载 antlr-x.x.x.jar
 
  2 、配置环境变量: classpath=.;x:\jdk\lib\tools.jar;x:\antlr-x.x.x.jar
 
  3 、在 t.g 所在目录下执行:
 
  java antlr.Tool t.g
 
  会在当前目录下生成如下文件:

  L.java : Lexer 文法分析器 java 类。
 
  P.java : Parser 解析器 java 类。
 
  PTokenTypes.java : Lexer 中定义的类型具体化,供 Parser 解析器调用。

  PTokenTypes.txt :当外部的(如 t2.g )要调用当前的类型或规则时要用到本文件。

  四、执行
 
  1 、编写 Main 类

  import java.io.*;
 
  class Main {

  public static void main(String[] args) {
 
  try {
 
  L lexer = new L(new DataInputStream(System.in));
 
  P parser = new P(lexer);

  parser.startRule();
 
  } catch(Exception e) {

  System.err.println("exception: "+e);
 
  }

  2 、执行
 
  c:\> javac *.java
 
  c:\> java Main

  Terence

  ^Z

  Hi there, Terence
  c:\>

原文转自:http://www.ltesting.net