虽然目前计算机编程语言有好几百种,但有时人们还是希望用一些简单的语言来实现特定的操作,只需要向计算机输入一个句子或文件,就能按照预定的文法规则来对句子或文件进行解释。例如,我们想要只输入一个加法/减法表达式,它就能够计算出表达式结果。例如输入“1 2 3-4 1”时,将输出计算结果为3。像C ,Java或C#都无法直接解释类似这样的字符串,因此用户必须自定义一套文法规则来实现对这些语句的解释,即设计一个自定义语言。如果所基于的编程语言是面向对象语言,此时可以使用解释器模式实现自定义语言。
解释器模式(Interpreter) | 学习难度:★★★★★ | 使用频率:★☆☆☆☆ |
---|
一、格式化指令的需求背景
Background:M公司开发了一套简单的基于字符界面的格式化指令,可以根据输入的指令在字符界面输出一些格式化内容,例如输入“LOOP 2 PRINT 杨过 SPACE SPACE PRINT 小龙女 BREAK END PRINT 郭靖 SPACE SPACE PRINT 黄蓉”,将输出以下结果:
其中,关键词LOOP表示循环,后面的数字表示循环次数;PRINT表示打印,后面的字符串表示打印的内容;SPACE表示空格;BREAK表示换行;END表示循环结束。每一个关键词对应一条指令,计算机程序将根据关键词执行相应的处理操作。
M公司的开发人员分析之后,根据格式化指令中句子的组成,定义了如下文法规则:
expression ::= command* // 表达式,一个表达式包含多条指令 command ::= loop | primitive // 语句指令 loop ::= 'loop number' expression 'end' // 循环指令,其中number为自然数 primitive ::= 'print string' | 'space' | 'byeak' // 基本指令,其中string为字符串
二、解释器模式概述
2.1 解释器模式简介
解释器模式是一种使用频率相对较低但学习难度较大的设计模式,它主要用于描述如何使用面向对象语言构成一个简单的语言解释器。
解释器(Interpreter)模式:定义一个语言的文法,并且建立一个解释器来解释该语言中的句子,这里的“语言”是指使用规定格式和语法的代码。解释器模式是一种行为型模式。
2.2 解释器模式结构
解释器模式主要包含以下4个角色:
(1)AbstractExpression(抽象表达式):声明了抽象的解释操作;
(2)TerminalExpression(终结符表达式):抽象表达式的子类,实现了与文法中的终结符相关联的解释操作,在句中的每一个终结符都是该类的一个实例;
(3)NonterminalExpression(非终结符表达式):抽象表达式的子类,实现了文法中非终结符的解释操作,由于在非终结符表达式中可以包含终结符表达式,也可以继续包含非终结符表达式,因此其解释操作一般通过递归完成。
(4)Context(环境类):又称为上下文类,用于存储解释器之外的一些全局信息,通常它临时存储了需要解释的语句。
三、格式化指令的具体实现
3.1 设计结构
M公司根据文法规则,通过进一步分析,结合解释器模式绘制了如下图所示的结构图:
其中,Context充当环境类角色,Node充当抽象表达式角色,ExpressionNode、CommandNode和LoopCommandNode充当非终结符表达式角色,PrimitiveCommandNode充当终结符表达式角色。
3.2 代码实现
(1)环境类:Context
代码语言:javascript复制 /// <summary>
/// 环境类:用于存储和操作需要解释的语句,
/// 在本实例中每一个需要解释的单词都可以称为一个动作标记(ActionToker)或命令
/// </summary>
public class Context
{
private int index = -1;
private string[] tokens;
private string currentToken;
public Context(string text)
{
text = text.Replace(" ", " ");
tokens = text.Split(' ');
NextToken();
}
// 获取下一个标记
public string NextToken()
{
if (index < tokens.Length - 1)
{
currentToken = tokens[ index];
}
else
{
currentToken = null;
}
return currentToken;
}
// 返回当前的标记
public string GetCurrentToken()
{
return currentToken;
}
// 跳过一个标记
public void SkipToken(string token)
{
if (!token.Equals(currentToken, StringComparison.OrdinalIgnoreCase))
{
Console.WriteLine("错误提示:{0} 解释错误!", currentToken);
}
NextToken();
}
// 如果当前的标记是一个数字,则返回对应的数值
public int GetCurrentNumber()
{
int number = 0;
try
{
// 将字符串转换为整数
number = Convert.ToInt32(currentToken);
}
catch (Exception ex)
{
Console.WriteLine("错误提示:{0}", ex.Message);
}
return number;
}
}
(2)抽象表达式:Node
代码语言:javascript复制 /// <summary>
/// 抽象表达式:抽象节点类
/// </summary>
public abstract class Node
{
// 声明一个方法用于解释语句
public abstract void Interpret(Context context);
// 声明一个方法用于执行标记对应的命令
public abstract void Execute();
}
(3)非终结符表达式:ExpressionNode、CommandNode和LoopCommandNode
代码语言:javascript复制 /// <summary>
/// 非终结符表达式:表达式节点类
/// </summary>
public class ExpressionNode : Node
{
// 用于存储多条命令的集合
private IList<Node> nodeList = new List<Node>();
public override void Interpret(Context context)
{
// 循环处理Context中的标记
while (true)
{
// 如果已经没有任何标记,则退出解释
if (context.GetCurrentToken() == null)
{
break;
}
// 如果标记为END,则不解释END并结束本次解释过程,可以继续之后的解释
else if (context.GetCurrentToken().Equals("END", StringComparison.OrdinalIgnoreCase))
{
context.SkipToken("END");
break;
}
// 如果为其它标记,则解释标记并加入命令集合
else
{
Node node = new CommandNode();
node.Interpret(context);
nodeList.Add(node);
}
}
}
// 循环执行命令集合中的每一条指令
public override void Execute()
{
foreach (var node in nodeList)
{
node.Execute();
}
}
}
/// <summary>
/// 非终结符表达式:语句命令节点类
/// </summary>
public class CommandNode : Node
{
private Node node;
public override void Interpret(Context context)
{
// 处理LOOP指令
if (context.GetCurrentToken().Equals("LOOP", StringComparison.OrdinalIgnoreCase))
{
node = new LoopCommand();
node.Interpret(context);
}
// 处理其他指令
else
{
node = new PrimitiveCommand();
node.Interpret(context);
}
}
public override void Execute()
{
node.Execute();
}
}
/// <summary>
/// 非终结符表达式:循环命令类
/// </summary>
public class LoopCommand : Node
{
// 循环次数
private int number;
// 循环语句中的表达式
private Node commandNode;
public override void Interpret(Context context)
{
context.SkipToken("LOOP");
number = context.GetCurrentNumber();
context.NextToken();
// 循环语句中的表达式
commandNode = new ExpressionNode();
commandNode.Interpret(context);
}
public override void Execute()
{
for (int i = 0; i < number; i )
{
commandNode.Execute();
}
}
}
(4)终结符表达式:PrimitiveCommandNode
代码语言:javascript复制 /// <summary>
/// 终结符表达式:基本命令类
/// </summary>
public class PrimitiveCommand : Node
{
private string name;
private string text;
public override void Interpret(Context context)
{
name = context.GetCurrentToken();
context.SkipToken(name);
if (!name.Equals("PRINT", StringComparison.OrdinalIgnoreCase)
&& !name.Equals("BREAK", StringComparison.OrdinalIgnoreCase)
&& !name.Equals("SPACE", StringComparison.OrdinalIgnoreCase))
{
Console.WriteLine("非法命令!");
}
if (name.Equals("PRINT", StringComparison.OrdinalIgnoreCase))
{
text = context.GetCurrentToken();
context.NextToken();
}
}
public override void Execute()
{
if (name.Equals("PRINT", StringComparison.OrdinalIgnoreCase))
{
Console.Write(text);
}
else if (name.Equals("SPACE", StringComparison.OrdinalIgnoreCase))
{
Console.Write(" ");
}
else if (name.Equals("BREAK", StringComparison.OrdinalIgnoreCase))
{
Console.Write("rn");
}
}
}
(5)客户端测试:
代码语言:javascript复制 public class Program
{
public static void Main(string[] args)
{
string instruction = "LOOP 2 PRINT 杨过 SPACE SPACE PRINT 小龙女 BREAK END PRINT 郭靖 SPACE SPACE PRINT 黄蓉";
Context context = new Context(instruction);
Node node = new ExpressionNode();
node.Interpret(context);
Console.WriteLine("源指令 : {0}", instruction);
Console.WriteLine("解释后 : ");
node.Execute();
Console.ReadKey();
}
}
编译调试后运行结果如下图所示:
四、解释器模式小结
4.1 主要优点
(1)易于改变和扩展文法 => 通过继承来改变或扩展
(2)增加新的解释表达式较为方便 => 只需对应新增一个新的终结符或非终结符表达式,原有代码无须修改,符合开闭原则!
4.2 主要缺点
(1)对于复杂文法难以维护 => 一条规则一个类,如果太多文法规则,类的个数会剧增!
(2)执行效率较低 => 使用了大量循环和递归,在解释复杂句子时速度很慢!
4.3 应用场景
(1)可以将一个需要解释执行的语言中的句子表示为一个抽象语法树
(2)一些重复出现的问题可以用一种简单的语言来进行表达
(3)一个语言的文法较为简单
(4)执行效率不是关键问题 => 高效的解释器通常不是通过直接解释抽象语法树来实现的
参考资料
(1)刘伟,《设计模式的艺术—软件开发人员内功修炼之道》
作者:周旭龙
出处:http://edisonchou.cnblogs.com
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。