第三章:词法分析与有穷自动机
考察内容就是:已知文法求正规式;已知正规式求文法;
正规式的性质:
- A|B = B|A
- A|(B|C) = (A|B)|C
- A(BC) = (AB)C
- A(B|C) = AB|AC
- (A|B)C = AC|BC
- A(伊姆逊)|(伊姆逊)A = A
- A* = AA*|(伊姆逊)=A|A* = (A|(伊姆逊))*
- (A*)* = A*
正规文法到正规式的转换:
- 将正规文法中的每个非终结符表示成关于它的一个正规式方程,获得一个联立方程组;
- 依照求解规则: 若x=ax|b 或(x=ax b) 则解为x=a*b;
- 若x=xa|b 或(x=xa b) 则解为x=ba*;
正规式到正规文法的转换:
- 令Vt=∑;
- 对任意的正规式R,用一个非终结符S作为文法的开始符号;
- 对A->ab转换成A->aB和B->b;
- 对A->a*b转换成A->aA|b;
- 不断运用3和4中的规定进行变换,直到每条规则最多含有一个终结符为止;
正规式与有穷自动机:
利用有穷自动机构造词法分析程序的方法是:
- 从语言单词的描述中构造出非确定的有穷自动机;
- 再将非确定的有穷自动机转化成确定的有穷自动机;
- 将其化简为状态最少化的DFA;
- 对DFA的每个状态构造一小段程序将其转化为识别语言单词的词法分析程序;
确定有穷自动机(DFA):
非确定有穷自动机(NFA):
由正规式R构造NFA:
NFA确定化为DFA的方法:
DFA的化简:
有穷自动机到正规式的转换,参考正规式转换为有穷自动机,基本的就是那三个规则转换;