用递归下降方法实现算术表达式解析器
对于形如2*2+2/1+3的算术表达式,如果不将优先级顺序考虑进去的话,那么解析如上的表达式十分容易,
| 1 2 3 4 5 6 | a = get first operandwhile(operand present){op = get operatorb = get second operanda = a op b} | 
如果将优先级考虑进去的话,而且还使用上述算法,那么复杂度可想而知.在此,我用递归下降的方式实现解析有优先级的算术表达式.
在此解析的算术表达式,由如下元素组成:
- 数字
- 运算符+ - * / %
运算符的优先级如下
% / * > + -
优先级相等的运算符从左向右顺序计算
在使用递归向下解析器时,表达式被视为递归的数据结构,那么所有的表达式可以由如下的规则生成
表达式 ->项 [+项][-项]
项 -> 因数 [*因数][/因数][%因数]
因数 -> 数字 或表达式
注意,上面的生成规则是以表达式中只包含+-*/%运算符且无变量为前提的,而且生成规则也包含了运算优先级,下面举例说明表达式的解析过程
2*3+2
有两个项,分别为2*3和2,前者包含两个因素2,3
下面以一个例子跟踪递归向下解析过程
2*3+3*4
- 获得第一项2*3
- 计算得到6
- 获得第二项3*4
- 计算得到12
- 从第二项递归计算过程返回
- 6+12计算得到18
为计算表达式的值,需要对表达式进行分解,例如2*3-4可以分解成2,*,3,-,4四个元素,这些元素在解析器术语中称为标识符,是一个不能再分的独立单元.为了将表达式分解一独立的元素单元,需要设计一个过程,该过程能从头至尾扫描整个表达式,顺序地返回每个元素,并且能够识别每个元素的,在本解析器,实现该功能的函数称为getToken.
本文的解析器封装在一个Parser的类中,为对getToken功能有个更好的理解,现说明它的第一部分
2 class Parser{
3 //标识符的类型种类
4 final int NONE = 0;
5 final int NUMBER= 1;
6 final int DELIMITER = 2;
7
8 //异常的类型
9 final int NOEXP = 0;
10 final int SYNTAX = 1;
11 final int DIVBYZERO = 2;
12
13 final String EOE = "\0";//标明表达式结尾
14 private int tokType;//用于存放标识符类型
15 private String token;//用于存放标识符
16 private String exp;//用于存放表达式
17 private int expIdx;//在表达式中的当前位置
解析器解析表达式时,每个标识符必须有与之关联的标识符,本解析器只用到2种类型,分别为NUMBER,DELIMITER.此外NONE类型只是当标识符未定义时的一个占位符.
此外,Parser类还定义几个异常,其中NOEXP是当解析器解析时没有表达式,SYNTAX代表表达式不符合规则的错误,DIVBYZERO代表除数为0时的错误.
final变量EOE表示解析器己达到表达式的结尾.
被解析的表达式己字符串形式保存,exp保存该字符串的一个引用,exIdx保存下一个标识符在exp中的索引,初始值为0.当前标识符保存在token中,其类型则保存在tokType.这些变量都是private型,只允许解析器自己访问而不能被外部代码修改.
下面列出getToken函数的完整代码,每调用一次getToken(),将得到表达式的下一个标识,也就是exp[expIdx]后的一个标识.getToken()将标识符保存在token中,标识符类型则保存在tokType之中.
token = "";
tokType = NONE;
if(expIdx == exp.length()){
token = EOE;
return;
}
while(expIdx < exp.length() && Character.isWhitespace(exp.charAt(expIdx))) expIdx++;
if(expIdx >= exp.length())
{
token = EOE;
return;
}
if(isDelim(exp.charAt(expIdx))){//是运算符
token += exp.charAt(expIdx));
tokType = DELIMITER;
expIdx ++;
} else if(Character.isDigit(exp.charAt(expIdx))){//是数字
while(!isDelim(exp.charAt(expIdx))){
token += exp.charAt(expIdx);
if(expIdx >= exp.length())
break;
}
tokType = NUMBER;
} else {//不知名的字符结束字符串
token = EOE;
return;
}
}
private boolean isDelim(char c){//判断字符是否是运算符
if((" +-*/%").indexOf(c) != -1)
return true;
return false;
}
}
下面简单分析下getToken().getToken()首先做初始化工作,然后查看expIdx是否等于表达式的.由于expIdx保存的是解析器解析表达当前的进度,如果expIdx和exp.length(),那么表明解析器完成了表达式的解析.
如果解析器还能找到未处理的标识符,则解析过程继续进行.首先跳过下一个标识符之前所有的空格,如果表达式以空格结尾,则返回EOE结尾.根据exp[expIdx]后的一个字符的类型不同,getToken()对当前标识符的处理过程不同.如果一个字符为运算符,那么getToken()将当前标识符保存在token中,并将tokType设置为DELIMITER.若下一个字符为数字,token保存当前标识符,并将tokType设为NUMBER.如果下一个字符不为以上两种之一,则token保存EOE返回.
下面为解析器的代码,这个解析器只能解析由数字和运算符组成的表达式,其中运行符只包含+-*/%.
| classParserException extendsException{privateString error;publicParserException(String error){this.error = error;}publicString toString(){returnerror;}}classParser {finalintNONE = 0;finalintNUMBER = 1;finalintDELIMITER = 2;finalintNOEXP = 0;finalintSYNTAX = 1;finalintDIVBYZERO = 2;finalString EOE = "\0";privateString exp;privateString token;privateintexpIdx;privateinttokType;//解析入口publicdoubleevaluate(String expStr) throwsParserException{this.exp = expStr;this.expIdx = 0;doubleresult;getToken();if(token.equals(EOE)){handleErr(NOEXP);}result = evalExp1();if(!token.equals(EOE)){handleErr(SYNTAX);}returnresult;} | 
| //加或减privatedoubleevalExp1() throwsParserException{doubleresult;doublepartialResult;charop;result = evalExp2();while((op = token.charAt(0)) == '+'|| op == '-'){getToken();partialResult = evalExp2();switch(op){case'+':result += partialResult;break;case'-':result -=partialResult;break;}}returnresult;} | 
| //乘或除或取余privatedoubleevalExp2() throwsParserException{doubleresult;doublepartialResult;charop;result = atom();while((op = token.charAt(0)) == '*'|| op == '/'|| op == '%'){getToken();partialResult = atom();switch(op){case'*':result *= partialResult;break;case'/':if(partialResult == 0.0) handleErr(DIVBYZERO);result /=partialResult;break;case'%':result %= partialResult;break;}}returnresult;} | 
| //获得数的值privatedoubleatom() throwsParserException{doubleresult = 0.0;switch(tokType){caseNUMBER:try{result = Double.parseDouble(token);getToken();}catch(NumberFormatException exc){handleErr(SYNTAX);}break;default:handleErr(SYNTAX);}returnresult;} | 
| //错误处理privatevoidhandleErr(interror) throwsParserException{String[] errs = {"表达式不存在","表达式不符合规则","除数为0"};thrownewParserException(errs[error]);}//获得下一个标识符privatevoidgetToken(){token = "";tokType = NONE;//检查表达式是否到达末尾if(expIdx == exp.length()){token = EOE;return;}//去掉空格while(expIdx < exp.length() && Character.isWhitespace(exp.charAt(expIdx))) expIdx++;//当表达式以空格结束if(expIdx >= exp.length()){token = EOE;return;}if(isDelim(exp.charAt(expIdx))){//是运算符token += exp.charAt(expIdx);tokType = DELIMITER;expIdx ++;} elseif(Character.isDigit(exp.charAt(expIdx))){//是数字 while(!isDelim(exp.charAt(expIdx))){token += exp.charAt(expIdx);expIdx ++;if(expIdx >= exp.length())break;} tokType = NUMBER;} else{//不知名的字符结束字符串token = EOE;return;}}privatebooleanisDelim(charc){//判断字符是否是运算符if((" +-*/%").indexOf(c) != -1)returntrue;returnfalse;}} | 
在代码最开始部分声明了一个ParserException类,这是一个异常类,当解析器解析表达式时就会根据异常类抛出特定的,该异常的处理需要使用该解析器的主程序处理.使用该解析器的方法是先实例化一个Parser,然后将一个表达式字符串传入该实例的evaluate方法,该方法返回最终的结果.下面的代码 说明解析器的使用方法.
| importjava.io.*;publicclassPDemo{publicstaticvoidmain(String[] args){String expr;        BufferedReader br = new            BufferedReader(newInputStreamReader(System.in));           Parser p = newParser();        System.out.println("Enter an empty expression to stop");        for(;;){            System.out.print("Enter expression:");            expr = br.readLine();            if(expr.equals("")) break;            try{                System.out.println("Result :"+p.evaluate(expr));                System.out.println();            }catch(ParserException exc){                System.out.println(exc);            }            }}} | 
转载请指明出处http://cnblogs.com/notifyer
 
                     
                    
                 
                    
                

 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号