美文网首页编译器
LLVM 编译器 原理解析, 插件编写

LLVM 编译器 原理解析, 插件编写

作者: 咖啡豆8888 | 来源:发表于2018-08-16 16:43 被阅读58次

    前言

    • 官网地址 : LLVM
    • LLVM项目是模块化,可重用的编译器以及工具链技术的集合
    • 创始人,亦是Swift之父 Chris Lattner

    编译器

    • GCC
    • LLVM
    • Clang
      编译器原理: 将代码首先进过编译器前端,目的是将代码规范化(词法分析,语法分析),检查错误等操作,
      然后生成编译中间代码(LLVM IR),然后经过编译器后端不同架构生成对应的机器码(x86,PC,ARM不同处理器生成不同的机器码)
    • LLVM架构展示:


      LLVM架构展示

    Clang

    • Clang 属于LLVM项目的一个子项目,基于LLVM架构的C/C++ / Objective-C 编译器前端
    • Clang
    • 相比GCC,有如下优点:
      1.编译速度快 3倍
      2.占用内存小 1/5左右
      3.模块化设计 易于IDE集成
      4.诊断信息可读性强 提示信息更加友善

    OC源文件的编译过程

    1. 查看编译过程指令
      clang -ccc-print-phases main.m

      编译过程
    2. 查看preprocessor(预处理)的结果,替换全局变量,词法/语法分析等
      clang -E main.m

      编译预处理
      • 词法分析指令:(作用是每个单词会生成一个token)
        clang -fmodules -E -Xclang -dump-tokens main.m
        词法分析
      • 生成语法树
        clang -fmodules -fsyntax-only -Xclang -ast-dump main.m
        语法树
    3. 生成中间代码
      LLVM IR 有三种标识形式,但本质上是等价的,好比水可以是气态,液态,固态

      • text,便于阅读的文本格式,类似汇编语言,扩展名是.ll
        clang -S -emit-llvm main.m
      • 内存格式
      • 二进制格式,扩展名.bc
        clang -c -emit-llvm main.m
        中间代码text格式
      • IR的基本语法:
    1.注释是以;开头的
    2.全局标识符以@开头,局部标识符以%开头
    3.alloca,在当前函数栈帧中分配内存
    4. i32,  32bit,4个字节的意思
    5. align 内存对齐
    6. store,写入数据
    7. load 读取数据
    

    更多指令

    未完待续....

    相关文章

      网友评论

        本文标题:LLVM 编译器 原理解析, 插件编写

        本文链接:https://www.haomeiwen.com/subject/xiunbftx.html