GCC编译优化

GCC编译优化

作者: 谭英智 | 来源:发表于2021-10-19 15:32 被阅读0次

GCC编译优化
LVVM
iOS App编译流程
gcc命令
linux CentOS8安装redis
【Xcode编译原理】
5_嵌入式C语言编译器
1.准备
centos编译mysql源码
LLVM资料整理

编译优化

如果不指定优化标志，gcc会产生可调试的代码

启用优化后，gcc会改变程序的结构，让代码变小或者运行得更快

-O0

不优化

-O, -O1

在不影响编译速度的情况下，尽量采取一些优化算法降低代码大小和加快代码运行的速度，并启用以下优化选项：

fauto-inc-dec

地址访问时，合并地址访问指令和地址的递增和递减操作
fbranch-count-reg

在计数寄存器中运行递减和分支指令

而不是单独运行递减指令，并与零比较，然后再根据结果进行分支
combine-stack-adjustments

跟踪堆栈的push和pop，并尝试找到合并它们的方法
fcompare-elim

判断计算结果的flag寄存器，如果可以，用flag寄存器的结果来代替现式地比较操作
fcprop-registers

通过寄存器存有的值，通过计算变量的依赖，减少从内存中读取该变量的值，通过拷贝传播，来减少变量的拷贝
-fdce

消除死代码
-fdefer-pop

程序一般在函数返回时，会pop出栈中元素

而编译器，会合并多个函数调用，并一次性pop出相关的元素
-fdelayed-branch

尝试对指令重新排序，来利用延迟分支指令后可用的指令槽
-fdse

对死代码进行消除
-fforward-propagate

The pass tries to combine two instructions and checks if the result can be simplified. If loop unrolling is active, two passes are performed and the second is scheduled after loop unrolling.
-fguess-branch-probability

分支预测
-fif-conversion2

利用条件执行把if条件转化为无分支等价代码
-fif-conversion

利用moves, min, max, set, abs等手段把if条件转化为无分支等价代码
-finline-functions-called-once

把静态函数转为inline函数
-fipa-pure-const

发现函数是纯函数还是常量函数
-fipa-profile

对cold(仅调用一次的函数)函数进行优化
-fipa-reference
-fmerge-constants

合并常数计算
-fmove-loop-invariants

优化循环的不变量
-freorder-blocks

重排代码块
-fshrink-wrap

函数的开场白仅在使用前才初始化，而不是在函数开始的时候做
-fshrink-wrap-separate

把函数的开场白和结束语分开，尽在使用的时候才初始化
-fsplit-wide-types

对于某些需要占用多个寄存器的变量，独立的申请寄存器
-fssa-backprop

在定义链上传播相关使用的信息，来简化定义
-fssa-phiopt

优化条件代码
-fstore-merging

合并存储
-ftree-bit-ccp

在tree上传播稀疏条件位常量，并对齐传播指针
-ftree-ccp

在tree上传播稀疏条件常量，并对齐传播指针
-ftree-ch
-ftree-coalesce-vars
-ftree-copy-prop
-ftree-dce
-ftree-dominator-opts
-ftree-dse
-ftree-forwprop
-ftree-fre
-ftree-phiprop
-ftree-sink
-ftree-slsr
-ftree-sra
-ftree-pta
-ftree-ter
-funit-at-a-time

-O2

会牺牲一定的编译速度，除了执行O1的所有编译优化之外，还会采取几乎所有的目标配置支持的优化算法，用来提高目标代码的运行速度

-fthread-jumps

判断是否有double jump，并进行优化
-falign-functions

把函数的开始地址对齐到2的幂
-falign-jumps

把分支的起点地址对齐到2的幂
-falign-loops

把循环的开始地址对齐到2的幂
-falign-labels

把标签的地址对齐到2的幂
-fcaller-saves
-fcrossjumping
-fcse-follow-jumps
-fcse-skip-blocks
-fdelete-null-pointer-checks

检查是否存在delete空指针
-fdevirtualize -fdevirtualize-speculatively

用子类虚函数覆盖虚函数函数指针
-fexpensive-optimizations
-fgcse -fgcse-lm

全局的公用子表达式优化
-fhoist-adjacent-loads
-finline-small-functions

把小函数优化为内联函数
-findirect-inlining
-fipa-cp

过程间常数传播
-fipa-cp-alignment
-fipa-bit-cp
-fipa-sra

过程间优化，删除未使用的参数，将值传递优化为引用传递
-fipa-icf
-fisolate-erroneous-paths-dereference

检测由于取消空指针而触发错误或未定义行为的路径，将这些路径隔离
-flra-remat

通过上下文敏感，重用变量
-foptimize-sibling-calls

优化同级和尾部递归调用
-foptimize-strlen

优化strlen函数
-fpartial-inlining

部分内联函数
-fpeephole2

机器相关优化
-freorder-blocks-algorithm=stc

块内代码重排优化
-freorder-blocks-and-partition -freorder-functions

重排代码
-frerun-cse-after-loop

重新运行公共表达式减少在循环后
-fsched-interblock -fsched-spec

在不同块间进行重排指令
-fschedule-insns -fschedule-insns2
-fstrict-aliasing

类型严格转换检查
-fstrict-overflow

检查类型是否溢出
-ftree-builtin-call-dce
-ftree-switch-conversion -ftree-tail-merge
-fcode-hoisting
-ftree-pre
-ftree-vrp
-fipa-ra

函数调用者，如果某些寄存器没有用到，则可以不需要保存这些寄存器的值

-O3

除了执行O2所有的优化选项之外，一般还会采用很多向量化算法，提高程序的并行度，并利用CPU的流水线和cache来加快运行速度，

这个选项会加大代码的大小，并降低目标代码的执行时间

-finline-functions

采用一些启发式算法对函数进行内联
-funswitch-loops

找到循环的不变条件，并移到循环外部
-fpredictive-commoning

在循环间重用计算
-fgcse-after-reload

执行全局的共同子表达式消除
-ftree-loop-vectorize

向量化优化
-ftree-loop-distribute-patterns

把loop的某些部分转化为标准函数，例如memset
-fsplit-paths
-ftree-slp-vectorize

基本块向量化
-fvect-cost-model
-ftree-partial-pre

部分冗余代码消除
-fpeel-loops
-fipa-cp-clone

过程间调用函数克隆，让常量传播更有效

-Os

目的是尽量减少目标代码的大小，这对存储容量很小的设备尤为重要

-falign-functions

对齐
-falign-jumps

对齐
-falign-loops

对齐
-falign-labels

对齐
-freorder-blocks

重排
-freorder-blocks-algorithm=stc

重排
-freorder-blocks-and-partition

重排
-fprefetch-loop-arrays

预取

-Ofast

除了启用所有O3的优化选项之外，还会针对某些语言启用部分优化

-Og

目的是保留较好的可调试信息的前提下提供合理的优化

GCC常用选项

-E: 预处理
-S: 编译
-c: 编译汇编不链接
-g: 包含调试信息
-I: 指定include头文件目录
-o: 输出编译文件
-w: 忽略所有警告
-Werror: 不区分警告和错误，遇到任何警告都停止编译
-Wall: 开启大部分告警提示
-Wshadow: 作用域相关存在变量同名时发出告警
-Wextra: 对所有合法但值得怀疑的表达式发出告警

ref: https://gcc.gnu.org/onlinedocs/gcc-7.2.0/gcc/Optimize-Options.html

相关文章

GCC编译优化
编译优化如果不指定优化标志，gcc会产生可调试的代码启用优化后，gcc会改变程序的结构，让代码变小或者运行得更...
LVVM
什么是 LVVM 案列（编译器类名报错）编译器三大编译器：GCC、LVVM、Clang 传统编译前端、优化器...
iOS App编译流程
三大编译器详解GCC / Clang / LLVM 传统的编译器通常分为三个部分，前端(frontEnd)，优化器...
gcc命令
语法 gcc(选项)(参数) 选项 -o：指定生成的输出文件；-On：n为数字1~3，使用编译优化级别n编译程序；...
linux CentOS8安装redis
安装编译工具安装编译工具# yum install -y gcc gcc-c++检查gcc的版本# gcc --...
【Xcode编译原理】
GCC编译器 Xcode4之前,Xcode是用GCC编译器来翻译代码的;GCC编译器是开源免费的编译器 GCC :...
5_嵌入式C语言编译器
关键词：GCC与gcc有什么不同、交叉编译、 gcc关键编译选项 1. GCC与gcc有什么不同？ GCC（GNU...
1.准备
gcc使用 1.gcc编译流程：1)预处理：gcc -E2)编译：gcc -S3)汇编：gcc -c4)链接：没参...
centos编译mysql源码
源码获取安装GCC 安装CMake(依赖gcc gcc++) 安装bison 设置编译文件 cmake编译创建...
LLVM资料整理
LLVM是模块化、可重用的编译器以及工具链技术的 GCC、LLVM、clang 传统的编译器架构：前端-优化器（中...

网友评论

本文标题：GCC编译优化

本文链接：https://www.haomeiwen.com/subject/oneaoltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|GCC编译优化|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！