美文网首页
CH8.7 查看编译器优化结果

CH8.7 查看编译器优化结果

作者: 磊宝万岁 | 来源:发表于2019-05-19 22:09 被阅读0次

8.7 查看编译的结果

编译器形成汇编代码做了很多事情,但是有些情况下他做的并不是很好,如果我们能够查看汇编代码并且有目的的优化那是最好不过了。
在gcc中可以使用-fsource-asm选项来查看c代码与汇编代码的对应关系,因为只加-S参数的话在.s文件中不会显示源代码只会显示行数。

gcc xx.c -S -fsource-asm

注意 如果你想看看编译器完全优化之后的样子,就不要开启-fsource-asm选项。

下面的例子展示了如何通过汇编代码来优化我们的程序:加入我们有这个一个程序:

void Func(int a[], int & r) {
  int i;
  for (i = 0; i < 100; i++) {
    a[i] = r + i/2;
  }
}

编译后该部分代码是这样的:

ALIGN 4 ; align by 4
PUBLIC ?Func@@YAXQAHAAH@Z ; mangled function name
?Func@@YAXQAHAAH@Z PROC NEAR ; start of Func
; parameter 1: 8 + esp ; a
; parameter 2: 12 + esp ; r
    $B1$1:                        ; unused label
    push ebx                      ; save ebx on stack
    mov ecx, DWORD PTR [esp+8]    ; ecx = a
    xor eax, eax                  ; eax = i = 0
    mov edx, DWORD PTR [esp+12]   ; edx = r
$B1$2:                            ; top of loop
    mov ebx, eax                  ; compute i/2 in ebx
    shr ebx, 31                   ; shift down sign bit of i
    add ebx, eax                  ; i + sign(i)  ;; == i + 1 ,because of division operation
    sar ebx, 1                    ; shift right = divide by 2
    add ebx, DWORD PTR [edx]      ; add what r points to
    mov DWORD PTR[ecx+eax*4],ebx  ; store result in array
    add eax, 1                    ; i++
    cmp eax, 100                  ; check if i < 100
    jl $B1$2                      ; repeat loop if true
$B1$3:                            ; unused label
    pop ebx                       ; restore ebx from stack
    ret                           ; return
    ALIGN 4                       ; align
?Func@@YAXQAHAAH@Z ENDP           ; mark end of procedure

上面代码比较好懂,但是有个一个部分我是看了好久然后跟实验室同学讨论过后才明白,就是shr ebx, eax \n add ebx, eax这两步为什么要有i + sign(i)操作呢?
CSAPP上有详细的讲计算机补码的除法运算那一部分有讲:除法的补救部分,对于除数是2的指数可以用以为操作来计算,但是当被除数是负数的时候(第一位是1),单纯的移位不能得到正确的结果,但是有一个技巧就是对被除数加上一个“偏置”然后移位,比如说a / (2^k) 在计算机里面a是用a的补码表示的,计算方法就是 : (a_补 + 2^k-1) >> k; 如果a是正数就直接a>>k;
对应于上面汇编,因为除数是2(源代码里对应 "i / 2")所以如果i<0要对i进行"+2^1-1 = +1"操作,如果i>0就+0,正好对应+sign(i) 操作,不得不说编译器还真TM智能。

上面代码我们可能我们每天都会写,但是仔细阅读上面汇编我们可能发现如下问题:
1. i+sign(i)然后移位的操作虽然很秀,但是根本没必要,因为通过代码我们知道i是loop counter,不可能会小于0,所以除2操作直接移位就可以了;
2. add ebx, DWORD PTR [edx] ; add what r points to 这一步在循环中反复被执行,而我们知道这对应着一步访存操作,因为函数里面我们传的是&r,我们不知道r会不会在某一时刻改变,所以只能每次loop都重新从内存中load一遍,非常的耗时。
3. 由于r + i/2 是i的阶跃函数,所以我们可以把这个循环给展开来。

针对以上三点,我们修改后的代码如下:

void Func(int a[], int & r) {
  unsigned int i;
  int Induction = r;
  for (i = 0; i < 100; i += 2) {
    a[i] = Induction;
    a[i+1] = Induction;
    Induction++;
  }
}

编译后的代码如下:

ALIGN 4 ; align by 4
PUBLIC ?Func@@YAXQAHAAH@Z ; mangled function name
?Func@@YAXQAHAAH@Z PROC NEAR ; start of Func
; parameter 1: 4 + esp ; a
; parameter 2: 8 + esp ; r
$B1$1: ; unused label
    mov eax, DWORD PTR [esp+4]    ; eax = address of a
    mov edx, DWORD PTR [esp+8]    ; edx = address in r
    mov ecx, DWORD PTR [edx]      ; ecx = Induction
    lea edx, DWORD PTR [eax+400]  ; edx = point to end of a
$B2$2:                            ; top of loop
    mov DWORD PTR [eax], ecx      ; a[i] = Induction;
    mov DWORD PTR [eax+4], ecx    ; a[i+1] = Induction;
    add ecx, 1                    ; Induction++;
    add eax, 8                    ; point to a[i+2]
    cmp edx, eax                  ; compare with end of array
    ja $B2$2                      ; jump to top of loop
$B2$3:                            ; unused label
    ret                           ; return from Func
    ALIGN 4
; mark_end;

相关文章

  • CH8.7 查看编译器优化结果

    8.7 查看编译的结果 编译器形成汇编代码做了很多事情,但是有些情况下他做的并不是很好,如果我们能够查看汇编代码并...

  • LLVM

    一、编译器 性能优化:启动优化、界面优化、架构优化 编译型语言:OC(编译器是clang)、C(编译器可以直接执行...

  • c++如何避免编译优化

    我们很多时候都需要查看变量内容,但是变量的内容由于没有被用到会被编译器优化 这样就能关闭编译优化啦!!

  • 编写调试Pass

    LLVM Pass构成了LLVM编译器的转换和优化部分,构建这些转换使用的分析结果,是编译器的结构化技术。 All...

  • Linux 下如何绕过编译器优化

    本文首次发表在 Linux 下如何绕过编译器优化 有同学在群里聊到编译器优化的事情,很多时候期望编译器默认做优化,...

  • JMM造成指令重排的原因

    1、编译器优化 2、Processor 优化(流水线) 3、MESI缓存优化

  • iOS逆向之OC反汇编(上)

    本文主要讲解编译器的优化以及指针的汇编 编译器优化 设置 可在项目的BuildSetting->Optimizat...

  • 编译器常用优化方法

    常量传播在编译优化时, 能够将计算出结果的变量直接替换为常量。 编译器在进行编译的时候,将a直接由1替换。因此优化...

  • 编译优化算法

    参考资料: 1 编译器常用优化方法 常量传播 将能够计算出结果的变量直接替换为常量 优化后 常量折叠 多个变量计算...

  • 内联函数(Inline Function)

    场景:如果开启了编译器优化(Release模式默认会开启优化),编译器自动将某些函数变成内联函数 调用方式如下: ...

网友评论

      本文标题:CH8.7 查看编译器优化结果

      本文链接:https://www.haomeiwen.com/subject/ltdczqtx.html