什么是波兰表达式
我们日常的运算表达式通常是如下形式,这种成为中缀表达式,也就是运算符在运算数的中间。这种表达式人类人容易识别,并根据其进行计算,但计算机识别这种表达式非常困难。
a + b * (c - d) + e/f
因此,1920年,波兰科学家扬·武卡谢维奇(Jan ukasiewicz)发明了一种不需要括号的计算表达式的表示法将操作符号写在操作数之前,也就是前缀表达式,即波兰式(Polish Notation, PN)。上述中缀表达式转换为波兰表达式的格式如下:
+a+*b-cd/ef
从上面表达式可以看出,运算符在2个运算数的前面,因此波兰表达式也称为前缀表达式。为了便于理解,我们给出一个具体的实例,这个实例将上面的字母换成具体的数字(1 + 2 * (4 - 3) + 6/2),这个结果很容易看出来,也就是1 + 2*1 + 3 = 6。然后我们看一下波兰表达式的表示形式及运算过程。
+1+*2-4 3/ 6 2 // 从右向左扫描,当遇到运算符时计算其最近的右侧2个运算数
+1+*2-4 3 3 //先计算最右侧的数据,也就是 6/2=3
+1+*2 1 3 // 同理,4-3 = 1
+1+2 3 // 同理, 2*1= 1
+1+5
6
通过上面示例可以大概理解波兰表达式的计算过程,上面的运算符和运算数就可以通过通用的数据结构进行计算(请自己思考一下,我们后面再介绍)。
什么是逆波兰表达式
前面了解了波兰表达式,那什么是逆波兰表达式呢?波兰表达式也成为前缀表达式,而逆波兰表达式则成为后缀表达式,对比可以猜出来运算符在运算数后面的表达式就是逆波兰表达式。上述表达式如果采用逆波兰表达式则如下:
1 2 4 3 -*+ 6 2 / + //计算方式正好相反,也就是从左向右扫描
1 2 1 *+ 6 2 / +
1 2 + 6 2 / +
3 6 2 / +
3 3 +
6
从中缀表达式转换为逆波兰(后缀)表达式
从中缀表达式转换为后缀表达式的流程如下描述。需要注意的是,经过处理之后,中缀表达式中的括弧将被消除,也就是只剩下+-*/数学运算符。
- 从左至右扫描一中缀表达式。
- 若读取的是操作数,则判断该操作数的类型,并将该操作数存入操作数堆栈
- 若读取的是运算符
- 该运算符为左括号"(",则直接存入运算符堆栈。
- 该运算符为右括号")",则输出运算符堆栈中的运算符到操作数堆栈,直到遇到左括号为止。
- 该运算符为非括号运算符:
- 若运算符堆栈栈顶的运算符为括号,则直接存入运算符堆栈。
- 若比运算符堆栈栈顶的运算符优先级高,则直接存入运算符堆栈。
- 若比运算符堆栈栈顶的运算符优先级低或者相等,则输出栈顶运算符到操作数堆栈,并将当前运算符压入运算符堆栈。
- 当表达式读取完成后运算符堆栈中尚有运算符时,则依序取出运算符到操作数堆栈,直到运算符堆栈为空。
将中缀表达式转换成逆波兰表达式过程中,特别要注意对于中缀标到式中括号的处理。
- 要注意的,如果算符是"(",无论入栈中栈顶级别(只看栈顶)为何直接入栈,所以,“(”的等级
只用于对其后入栈的算符进行优先级比较,在“(”入栈时是无视优先级的。 - 在遇到")"时候找到最后进入的"(",并把"("前面所有的符号都压入出栈。不能仅凭运算符的级别来判断。
注: 逆波兰用的优先级有以下几种, 等级从高到低分别是:
1.* \
2.+ -
3.(
4.)
上面关于流程的表示文字比较多,看起来可能比较头疼。为了便于理解上述流程,我们依然通过上面的实例(1 + 2 * (4 - 3) + 6/2)进行介绍。在实际操作过程中需要一个栈和一个队列,分别存储运算符和操作数。
运算符堆栈 | 操作数队列 | 说明 |
---|---|---|
1 | 操作数直接入操作数的队列 | |
+ | 1 | 由于操作符的栈为空,因此可以直接入栈 |
+ | 1 2 | 操作数直接入队列 |
+ * | 1 2 | 由于*的优先级比+高,因此直接入栈 |
+ * ( | 1 2 | 左括弧不考虑优先级,直接入栈 |
+ * ( | 1 2 4 | 运算数直接入队列 |
+ * ( - | 1 2 4 | 运算符直接入栈,由于栈顶是(,因此不考虑优先级 |
+ * ( - | 1 2 4 3 | 运算数直接入队列 |
+ * | 1 2 4 3 - | 发现是右括弧,因此将其中的运算符逐个出栈,并压入运算数队列 |
+ | 1 2 4 3 - * + | 继续扫描表达式,+运算符比*优先级低,因此*出栈,压入运算数队列 |
+ | 1 2 4 3 - * + 6 | 运算数直接入队列 |
+ / | 1 2 4 3 - * + 6 | 高优先级运算符(/比+高)直接入栈 |
+ / | 1 2 4 3 - * + 6 2 | 运算数直接入队列 |
1 2 4 3 - * + 6 2 / + | 表达式已经没有内容,因此将运算符栈内容逐个出栈并压入操作数队列 |
通过上面整个过程的描述,并结合算法,相信大家对中缀表达式转换为后缀表达式(波兰表达式)已经非常清楚了。
逆波兰表达式的计算
逆波兰表达式的计算就比较简单了。以上面结果中的队列为输入,同时再准备一个栈用于运算。具体流程如下:
- 将队列中的数据依次出队,然后压栈;
- 在出队的过程中如果遇到运算符,则从栈中弹出2个运算数,分别作为右运算数和左运算数,进行运算;
- 将步骤2的运算结果入栈;
- 跳入步骤1,继续进行出队操作。
依然以上述内容为例进行介绍。
如图1中第一行左侧为形成的队列,右侧是一个空栈。将队列中操作数依次出队,入栈。
图1 操作数入栈
在出队的过程中遇到运算符(-),此时将操作数出栈进行运算(注意这里操作数的顺序)。
图2 进行运算
重复上述操作,直到将队列中所有内容出队。
图3 整个运算过程
网友评论