ARM汇编之解惑条件标志，条件码，条件执行

作者: 赵国开 | 来源:发表于2018-08-04 15:53 被阅读0次

ARM汇编之解惑条件标志，条件码，条件执行
ARM汇编
ARM 汇编指令学习:[0]编码格式与条件码域
【ARM 汇编基础速成6】ARM汇编之条件执行与分支
IOS arm64常用的汇编
<安全攻防之switch>
计算机的各类寄存器
第三章（2）
Android ARM逆向
004-判断语句

什么是条件执行（Conditional execution），它的机理是，根据运算结果更新的条件标志（condition flags），来判断指令的条件码（Condition code）是否符合条件，符合条件就执行，不符合条件则不执行。

A32/T32指令可以根据之前汇编指令更新的条件标志，来带条件的执行当前的汇编指令。为了让汇编指令带条件的执行，需要为汇编指令增加条件码后缀，这样就可以让处理器基于条件标志来测试是否需要执行该指令，如果条件测试不符，指令不会被执行，也不会影响其他任何标志，更不会产生异常，但是由于仍然占用了一个流水线空间，会消耗一个指令周期，除此之外什么也不会发生。

几乎所有A32的指令都可以基于APSR中的条件标志，进行带条件判断的执行。
而T32的话只支持部分指令带条件的执行，分支指令，CBZ（零条件分支）/CBNZ（非零条件分支）——根据寄存器结果是否为零在同一个执行状态下进行短距离（0～126字节）跳转，IT（If-Then,16位指令）。
同样在A64里面也只有少数指令可以真正的有条件执行（也就是说，要是条件测试不符，PC值仍然是往前增加的，除此没有别的影响），这些指令包括 B.EQ，CBNZ，CBZ，TBNZ，TBZ。

条件标志（condition flags）

总共有四个条件标志 N, Z, C, V，A32/T32中可存储更新到APSR寄存器最高的4个位置。大致示意图如下：

image.png

大部分的A32汇编指令编码中也会包含这四个位，而16位的T32指令大部分没有这些，所以不能带条件的执行，16位的指令编码带有的信息有限通常不会包含这四个位。

下面我们来说说，什么情况下这四个位会被置位/清除

条件标志	置位/清除
N	当运算的结果为负数的话置位，其他情况清0
Z	当运算的结果为0的话置位，其他情况清0
C	当运算的结果产生进位或者减法运算没有借位的话置位，其他情况清0
V	当运算的结果产生溢出的话置位，其他情况清0

可能看完上面的表还是有点不明白，下面继续进行补充说明。最复杂的是C位了（这也是今年大家都想要的一个位：）），那就先讲一下C位，C位会在下面四种情况下被置位：
- 无符号的（unsigned）加法运算（包括比较指令CMN）如果产生进位，C置位。
- 无符号的（unsigned）减法运算（包括比较指令CMP）如果没有借位（减完结果是正的），C置位。
- 移位操作也会影响C位（可以参考我之前文章中对移位操作介绍，ARM汇编指令中灵活的第二操作数，C的值是最后一个被移位器移出的位值，当然这个被移出的位值如果为1那么C值就为1
- 除了上面3种情况，C位通常是不会被改变的，但也有特殊指令会造成C位改变，这个如果自己在编程时会用到C位最好参考一下汇编指令手册，确认一下对应的指令是否对C位有特殊影响。

例子1

ldr r1,=0xffffffff
ldr r2,=0x2
adds r3,r1,r2

例子2

mov r2,#3
mov r1,#1
subs r3,r2,r1;r3 = r2 - r1

在来说一下V位，这个位是针对有符号的加法/减法及比较的，溢出，何为溢出呢，如果运算的结果大于等于2的31次方，或者小于负的2的31次方则V置位

例子：

ldr r1,=0x7fffffff
ldr r2,=0x2
adds r3,r1,r2

N位是用来检测运算结果是否为负数时比较有用。什么是负数呢，在计算机系统，负数通常用二进制的补码来表示，如果最高有效位被置位，则该二进制补码为负数。也就是说运算结果最高位为1那么N位就置位。

例子：

mov r1,#-1
mov r2,#-2
adds r3,r1,r2

Z位是最好理解的，只有运算的结果所有的位都为0则，Z置位。

例子：

mov r1,#0
mov r2,#0
adds r3,r1,r2

更新条件标志

在A32/T32中条件标志大部分情况下，不会自动更新到APSR中，只有你的指令明确的告诉它要更新它才会去更新，比如你在汇编指令中使用 S 后缀明确告诉它要去更新 APSR中的这些位。如下面的这条指令语法格式，你用ADDS就会去更新条件标志，用ADD就不会去更新。
ADD{S}{cond} {Rd}, Rn, Operand2
至于四个标志位被更新了几个，这个跟具体的指令有关，有的4位都更新了，有的只更新了1位或者都不更新。为什么会更新多位，因为计算机并不知道你操作的是有符号数还是无符号数，是正数还是负数，它只能傻傻的把所有可能全部给你列出来，所以你要对你写的程序负责，你要清楚你在做什么，你是做有符号的操作，还是无符号的操作，还是对正/负数操作，并以此选择你想要测试的条件标志位，来看操作结果是否符合预期，简单说就是你要什么，你就要去判断什么。

例子：

ldr r1,=0x7fffffff
ldr r2,=0x2
adds r3,r1,r2
bvc stop
nop
nop
nop

stop b stop

下图是上面程序运行之后，条件标志更新结果：

image.png

因为计算机不知道你要的是什么，所有它把所有情况都考虑进去了
- 如果r1，r2是无符号数，显然加法结果没有溢出因此C位为0
- 如果r1，r2是有符号数，加法结果超过了有符号数的上限而溢出因此V位为1
- 同时r3 = r1 + r3 = 0x80000001，最高位是1，因此N位也为1
- 计算的结果显然并不为0，因此Z为为0。

因此接下来你要用合适的条件码来对操作结果进行判断，比如你明确r1，r2是有符号数，你要判断有符号的加法是否溢出，你就需要对V位进行判断，如例子中的vc条件码。

备注：CMP, CMN,TEQ, TST这几条指令总是会更新条件标志位。他们没有S后缀的格式。如果带条件执行的指令没有被执行，它不会影响条件标志。

A64中这四个条件标志是放在NZCV系统寄存器的，除了CMP,CMN, CCMP, CCMN, TST这几条总是会更新条件标志的，其他指令需要更新条件标志同样需要带S的后缀。

条件码（Condition code）

条件码由两个字母组成，在A32/A64中支持条件码后缀的汇编指令中通常会有一个 {cond}的语法选项，比如下面ADD的语法格式
ADD{S}{cond} {Rd}, Rn, Operand2
对于T32指令，条件码在前面的IT指令中编码。

所有支持的条件码（下图第一列）及含义如下图所示

image.png

例子：

    mov r2,#6
    ldr r1,=0x7fffffff
    subs r3,r2,r1;r3 = r2 - r1
    bgt stop
    nop
    nop
    nop 
stop b stop

比较指令

上面提到的CMP, CMN,TEQ, TST这几条指令，总是会更新条件标志位，但运算结果总是被扔掉，不会进行保存。

他们的语法格式如下

CMP{cond} Rn, Operand2；Rn - Operand2 操作类似SUBS（除了扔掉运算结果）
CMN{cond} Rn, Operand2；Rn + Operand2 操作类似ADDS（除了扔掉运算结果）
TEQ{cond} Rn, Operand2；Rn EOR Operand2  操作类似EORS（除了扔掉运算结果）
TST{cond} Rn, Operand2；Rn AND Operand2  操作类似ANDS（除了扔掉运算结果）

备注：对TEQ和TST来说不会影响到V标志，N位和Z位会根据操作结果会被更新，Operand2移位操作也可能会影响到C位。而CMP和CMN则根据运算结果都有可能会被影响到。

例子：

    mov r1,#-1
    mov r2,#0
    tst r1,r2
    beq stop
    nop
    nop
    nop

stop b stop

为什么需要条件执行

因为条件执行比条件分支效率更高。在没有分支预测（至于什么是分支预测，有兴趣的同学可以参考计算机原理的相关书籍，有详细介绍）的ARM处理器上如果发生分支跳转，需要重填三个机器指令周期的流水线，当然如果有分支预测功能的ARM处理器在预测失败时，也是需要重填的。
下面是从ARM手册摘出来的一个例子：

C语言描述的算法如下：

int gcd(int a, int b)
{
    while (a != b)
      {
        if (a > b)
            a = a - b;
        else
            b = b - a;
      }
    return a;
}

如果用条件分支实现，代码如下：

gcd     CMP      r0, r1
        BEQ      end
        BLT      less
        SUBS     r0, r0, r1  ; could be SUB r0, r0, r1 for A32
        B        gcd
less
        SUBS     r1, r1, r0  ; could be SUB r1, r1, r0 for A32
        B        gcd
end

如果用带条件指令的条件执行，代码如下：

gcd
        CMP      r0, r1
        SUBGT    r0, r0, r1
        SUBLE    r1, r1, r0
        BNE      gcd

跟用分支执行的比较，该代码长度更小，而且执行的也更快。

参考资料

【1】DUI0801I_armasm_user_guide
【2】ARM Development Tools
【3】ARM Assembly Language_ Fundamentals and Techniques (2nd ed.)
【4】DDI0487C_a_armv8_arm

网友评论

本文标题：ARM汇编之解惑条件标志，条件码，条件执行

本文链接：https://www.haomeiwen.com/subject/bruomftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

ARM汇编之解惑条件标志，条件码，条件执行

条件标志（condition flags）

更新条件标志

条件码（Condition code）

比较指令

为什么需要条件执行

参考资料

相关文章