美文网首页
ARM循环汇编代码

ARM循环汇编代码

作者: 十曰立 | 来源:发表于2018-03-28 16:32 被阅读167次

    链接

    Java循环结构

     public static long testWhile(int value){
            int i=0;
            long sum = 0;
            while(i<=value){
                sum += i;
                i++;
            }
            return sum;
        }
    
        public static long testDoWhile(int value){
            long sum = 0;
            int i=0;
            do{
                sum += i;
                i++;
            }while(i<value);
            return sum;
        }
    
        public static long testFor(int value){
            long sum = 0;
            for(int i=0;i<=value;i++){
                sum += i;
            }
            return sum;
        }
    

    Thumb的循环结构

    C++代码与Java代码几乎是一字未改:

    long testWhile(int value){
        int i=0;
        long sum = 0;
        while(i<=value){
            sum += i;
            i++;
        }
        return sum;
    }
    
    long testDoWhile(int value){
        long sum = 0;
        int i=0;
        do{
            sum += i;
            i++;
        }while(i<value);
        return sum;
    }
    
    long testFor(int value){
        long sum = 0;
        for(int i=0;i<=value;i++){
            sum += i;
        }
        return sum;
    }
    

    我们下面来看看16位的Thumb指令是如何实现循环的。

    1. value参数传进来在r0;

    2. 将r2,r3清0;

    3. r2与参数传进来的r0比较;

    4. 如果0已经比r0大了,循环结束,将结果r3赋给r0,返回。

    5. 如果0比r0小,则继续循环,r3结果等于r3值加上r2值,r2值随后加1。

    6. 然后无条件回12b8那条比较语句,再判断r2是不是大于r0,如此循环。

    000012b4 <_Z9testWhilei>:
        12b4:    2300          movs    r3, #0
        12b6:    1c1a          adds    r2, r3, #0
        12b8:    4282          cmp    r2, r0
        12ba:    dc02          bgt.n    12c2 <_Z9testWhilei+0xe>
        12bc:    189b          adds    r3, r3, r2
        12be:    3201          adds    r2, #1
        12c0:    e7fa          b.n    12b8 <_Z9testWhilei+0x4>
        12c2:    1c18          adds    r0, r3, #0
        12c4:    4770          bx    lr
    

    后面两个也是语句位置变了变,本质是一样的。

    000012c6 <_Z11testDoWhilei>:
        12c6:    2300          movs    r3, #0
        12c8:    1c1a          adds    r2, r3, #0
        12ca:    18d2          adds    r2, r2, r3
        12cc:    3301          adds    r3, #1
        12ce:    4283          cmp    r3, r0
        12d0:    dbfb          blt.n    12ca <_Z11testDoWhilei+0x4>
        12d2:    1c10          adds    r0, r2, #0
        12d4:    4770          bx    lr
    
    000012d6 <_Z7testFori>:
        12d6:    2300          movs    r3, #0
        12d8:    1c1a          adds    r2, r3, #0
        12da:    4283          cmp    r3, r0
        12dc:    dc02          bgt.n    12e4 <_Z7testFori+0xe>
        12de:    18d2          adds    r2, r2, r3
        12e0:    3301          adds    r3, #1
        12e2:    e7fa          b.n    12da <_Z7testFori+0x4>
        12e4:    1c10          adds    r0, r2, #0
        12e6:    4770          bx    lr
    

    Thumb2的循环结构

    arm v7a的循环结构

    除了地址不同,与前面的Thumb指令完全相同.

    0000102c <_Z9testWhilei>:
        102c:    2300          movs    r3, #0
        102e:    461a          mov    r2, r3
        1030:    4282          cmp    r2, r0
        1032:    dc02          bgt.n    103a <_Z9testWhilei+0xe>
        1034:    4413          add    r3, r2
        1036:    3201          adds    r2, #1
        1038:    e7fa          b.n    1030 <_Z9testWhilei+0x4>
        103a:    4618          mov    r0, r3
        103c:    4770          bx    lr
    

    arm v8a的循环结构

    下面我们看第一个while循环在v8a上的实现:

    竟然动用了强大的NEON指令

    00000000000007c0 <_Z9testWhilei>:
     7c0:    2a0003e3     mov    w3, w0
     7c4:    37f80643     tbnz    w3, #31, 88c <_Z9testWhilei+0xcc>
     7c8:    51000c60     sub    w0, w3, #0x3
     7cc:    7100147f     cmp    w3, #0x5
     7d0:    53027c00     lsr    w0, w0, #2
     7d4:    11000464     add    w4, w3, #0x1
     7d8:    11000400     add    w0, w0, #0x1
     7dc:    531e7402     lsl    w2, w0, #2
     7e0:    5400050d     b.le    880 <_Z9testWhilei+0xc0>
     7e4:    100005e5     adr    x5, 8a0 <_Z9testWhilei+0xe0>
     7e8:    4f000484     movi    v4.4s, #0x4
     7ec:    4f000400     movi    v0.4s, #0x0
     7f0:    52800001     mov    w1, #0x0                       // #0
     7f4:    3dc000a1     ldr    q1, [x5]
     7f8:    0f20a422     sxtl    v2.2d, v1.2s
     7fc:    11000421     add    w1, w1, #0x1
     800:    4f20a423     sxtl2    v3.2d, v1.4s
     804:    6b01001f     cmp    w0, w1
     808:    4ea48421     add    v1.4s, v1.4s, v4.4s
     80c:    4ee08440     add    v0.2d, v2.2d, v0.2d
     810:    4ee08460     add    v0.2d, v3.2d, v0.2d
     814:    54ffff28     b.hi    7f8 <_Z9testWhilei+0x38>
     818:    5ef1b800     addp    d0, v0.2d
     81c:    6b02009f     cmp    w4, w2
     820:    4e083c00     mov    x0, v0.d[0]
     824:    540002c0     b.eq    87c <_Z9testWhilei+0xbc>
     828:    11000444     add    w4, w2, #0x1
     82c:    8b22c000     add    x0, x0, w2, sxtw
     830:    6b04007f     cmp    w3, w4
     834:    5400024b     b.lt    87c <_Z9testWhilei+0xbc>
     838:    11000841     add    w1, w2, #0x2
     83c:    8b24c000     add    x0, x0, w4, sxtw
     840:    6b01007f     cmp    w3, w1
     844:    540001cb     b.lt    87c <_Z9testWhilei+0xbc>
     848:    11000c44     add    w4, w2, #0x3
     84c:    8b21c000     add    x0, x0, w1, sxtw
     850:    6b04007f     cmp    w3, w4
     854:    5400014b     b.lt    87c <_Z9testWhilei+0xbc>
     858:    11001041     add    w1, w2, #0x4
     85c:    8b24c000     add    x0, x0, w4, sxtw
     860:    6b01007f     cmp    w3, w1
     864:    540000cb     b.lt    87c <_Z9testWhilei+0xbc>
     868:    11001442     add    w2, w2, #0x5
     86c:    8b21c000     add    x0, x0, w1, sxtw
     870:    6b02007f     cmp    w3, w2
     874:    8b22c001     add    x1, x0, w2, sxtw
     878:    9a80a020     csel    x0, x1, x0, ge
     87c:    d65f03c0     ret
     880:    d2800000     mov    x0, #0x0                       // #0
     884:    52800002     mov    w2, #0x0                       // #0
     888:    17ffffe8     b    828 <_Z9testWhilei+0x68>
     88c:    d2800000     mov    x0, #0x0                       // #0
     890:    d65f03c0     ret
     894:    d503201f     nop
     898:    d503201f     nop
     89c:    d503201f     nop
     8a0:    00000000     .inst    0x00000000 ; undefined
     8a4:    00000001     .inst    0x00000001 ; undefined
     8a8:    00000002     .inst    0x00000002 ; undefined
     8ac:    00000003     .inst    0x00000003 ; undefined
    

    相关文章

      网友评论

          本文标题:ARM循环汇编代码

          本文链接:https://www.haomeiwen.com/subject/phhucftx.html