美文网首页
初识汇编(一)

初识汇编(一)

作者: 请叫我大帅666 | 来源:发表于2018-04-21 09:17 被阅读0次

    汇编语言的发展

    机器语言 :

    由0和1组成的机器指令

    • 加: 0100 0000
    • 减: 0100 1000
    • 乘: 1111 0111 1110 0000
    • 除: 1111 0111 1111 0000

    汇编语言(assembly language) :

    使用助记符代替机器语言

    • 加:INC EAX 通过编译器 0100 0000
    • 减:DEC EAX 通过编译器 0100 1000
    • 乘:MUL EAX 通过编译器 1111 0111 1110 0000
    • 除:DIV EAX 通过编译器 1111 0111 1111 0000

    高级语言(High-level programming language) :

    比如Objective-C, swift, C更接近人类语言

    • 加:A+B 通过编译器 0100 0000
    • 减:A-B 通过编译器 0100 1000
    • 乘:A*B 通过编译器 1111 0111 1110 0000
    • 除:A/B 通过编译器 1111 0111 1111 0000

    代码在终端设备上的执行流程:

    Snip20180420_27.png
    • 汇编语言机器语言一一对应, 每条机器指令都有与其对应的汇编指令
    • 汇编语言可以通过编译得到机器语言, 机器语言也可以通过反汇编得到汇编语言
    • 高级语言可以通过编译得到汇编语言,机器语言; 但汇编语言,机器语言几乎不可能还原成高级语言(因为不同的高级语言有可能编译成同一条汇编/机器语言, 反过来汇编/机器语言就不能准确反编译成高级语言)

    汇编语言的特点

    • 直接访问, 控制各种硬件设备, 比如存储器, CPU, 能最大限度的发挥硬件的功能.
    • 能够不受编译器的控制, 对生成二进制的代码进行完全的控制.
    • 目标代码短, 占位内存少, 执行速度快
    • 汇编指令是机器指令的助记符, 和机器指令一一对应,每一种CPU都有自己的机器指令集/汇编指令集.
    • 不易于编写, 维护, 调试.
    • 不区分大小写, MOV和mov是一样的.

    汇编语言种类

    目前讨论比较多的汇编语言有:

     8086汇编: 8086是16bit位的CPU(大学时候学的)
     Win32汇编
     Win64汇编
     ARM汇编(前入式, Mac, iOS)
     ...
    

    我们iPhone使用的是ARM汇编, 但不同设备也有差异, 因为手机架构不同.


    Snip20180421_28.png

    必要常识:

    • 学号汇编, 首先需要了解CPU等硬件结构
    • APP/程序执行过程


      Snip20180421_29.png
    • 硬件相关最重要的是CPU, 内存.
    • 在汇编中, 大部分指令都是与CPU, 内存相关的

    总线

    Snip20180421_30.png
    • 总线: 一根根导线的集合.
    • 每一个CPU都有许多管脚, 这些管脚与总线相连, CPU通过管线与外部器件进行交互.
    • 总线分为: 地址总线, 数据总线, 控制总线
    微型计算机数据结构图.png

    举个栗子:

    • CPU从内存的3号单元读取数据


      读取数据.png
    • 地址总线

    地址总线的宽度决定了CPU的寻址能力
    8086的地址总线宽度是20, 所以它的寻址能力是2^20 (1M);

    • 数据总线

    数据总线的宽度决定了CPU单次传递的数据量, 也就是数据的传送速度
    8086的数据总宽度是16, 所以单次最大传送数据量是 2个字节

    • 控制总线

    控制总线的宽度决定了CPU对其他器件的控制能力, 能有多少种控制

    内存

    • 内存地址空间的大小受CPU地址总线宽度的限制。8086的地址总线宽度为20,可以定位220个不同的内存单元(内存地址范围0x00000~0xFFFFF),所以8086的内存空间大小为1MB
    • 0x00000~0x9FFFF:主存储器。可读可写
    • 0xA0000~0xBFFFF:向显存中写入数据,这些数据会被显卡输出到显示器。可读可写
    • 0xC0000~0xFFFFF:存储各种硬件\系统信息。只读

    进制

    • 八进制由8个符号组成: 0 1 2 3 4 5 6 7, 逢8进1
    • 十进制由10个符号组成: 0 1 2 3 4 5 6 7 8 9, 逢10进1
    • N进制就是由N个符号组成: 逢N进1
    • 十进制由10个符号组成, 逢10进1, 符号可以自定义!!!
      比如: 0 1 3 2 8 A B E S 7
      这样做的目的是什么?
      传统定义的十进制与我们自定义的十进制不同, 如果我们不将这10个符号表告诉别人, 别人就没法拿到我们具体的数据, 这种方法可用于加密!

    好了, 第一篇对于初识汇编的复习和梳理就到这了

    相关文章

      网友评论

          本文标题:初识汇编(一)

          本文链接:https://www.haomeiwen.com/subject/iheikftx.html