IOS 字符解析.

作者: 林初盛 | 来源:发表于2018-08-16 10:13 被阅读118次

    iOS 里涉及到C 语言的一些字节转换记录一下.
    先看一段代码,解析收到的 Data 里的 前6位 mac 地址

    //解析收到的 Data 里的前6位 mac 地址
    -(NSString *)getMAC:(NSData *)data{
    //length 是个 NSUInteger 型的数据,表示的是 data 里字节的长度.
        short len = (short)[data length];
    //bytes 是个指针,指向 data 的内容.char内容
        Byte *_bytes  = (Byte *)[data bytes];
        //创建一个长度为6的byte类型
        Byte *macData = malloc(6);
       //把 macData,0到6位初始化
        memset(macData, 0, 6);
       //开始拷贝,把_bytes 里面的数据考到 macData 里. 从 (Len-6)位开始拷贝.拷贝6位.加号代表从多少位开始拷贝.
        memcpy(macData, _bytes + (len-6), 6);
    //把字节数组转换位 NSData
        NSData  *mac =  [NSData dataWithBytes:macData length:6];
    
        NSString *ret = nil;
    
        if(mac != nil){
    
            int index = 0;
    
            while (index < 6) {
    
                if (ret != nil){
    
                    ret = [NSString stringWithFormat:@"%@:",ret];
    
                }
    
                if (ret == nil) {
    
                    ret = [NSString stringWithFormat:@"%02x", macData[index]];
    
                }else {
    
                    ret =[NSString stringWithFormat:@"%@%02x",ret, macData[index]];
    
                }
                index++;
            }
        }
        free(macData);
    
        return ret;
    
    }
    
    

    代码分析

    -(NSString *)getMAC:(NSData *)data{
    //length 是个 NSUInteger 型的数据,表示的是 data 里字节的长度.
        short len = (short)[data length];
    //bytes 是个指针,指向 data 的内容.char内容
        Byte *_bytes  = (Byte *)[data bytes];
    

    short len = (short)[data length];
    NSData和它的可变长子类 NSMutableData 是字节缓冲区的对象化封装。我们可以获得简单缓冲区,并进行一些转换操作。通常我们并不会直接创建字节数据,而是从其他类型的内容转换成字节数据。所谓简单缓冲区,就是缓冲区内只包含数据,无内嵌指针。
    简单来说,NSData 里放的是字节数据.我们获取到的是字节的长度(char).

    Byte *_bytes = (Byte *)[data bytes];
    _ bytes 是个指针,指向 data 的内容. 而 Byte 就 unsigned char 就是一个字节的长度.
    c++本身不存在BYTE关键字。但在C++中byte可以用unsigned char来表示,即无符号类型.
    OC中对 Byte 的定义:

    typedef  UInt8                          Byte;
    UInt8的定义:
    typedef  unsigned char                  UInt8; //无符号的 char
    typedef unsigned short                  UInt16;//无符号的 short
    >>>有符号和无符号的区别
    在内存中,char与unsigned char没有什么不同,都是一个字节,唯一的区别是,char的最高位为符号位,因此char能表示-128~127, unsigned char没有符号位,因此能表示0~255,这个好理解,8个bit,最多256种情况,因此无论如何都能表示256个数字。
    

    NSMutabelData中length与bytes的关系

    short len = (short)[data length];
    Byte *_bytes = (Byte *)[data bytes];
    length 是个 NSUInteger 型的数据,表示的是 data 的长度( data 里字节的长度.), bytes 是个指针,指向 data 的内容。不存在相等不相等,能不能相互替换的问题。
    @property(readonly) NSUInteger length
    The number of bytes contained by the data object.
    @property(readonly) const void *bytes
    A pointer to the receiver’s contents.


    
     //创建一个长度为6的byte类型
        Byte *macData = malloc(6);
       //把 macData,0到6位初始化
        memset(macData, 0, 6);
       //开始拷贝,把_bytes 里面的数据考到 macData 里. 从 (Len-6)位开始拷贝.拷贝6位.加号代表从多少位开始拷贝.
        memcpy(macData, _bytes + (len-6), 6);
    //把字节数组转换位 NSData
        NSData  *mac =  [NSData dataWithBytes:macData length:6];
    
    

    解析

    这里规定,数据 data 的最后6位是mac地址.所以在获取到数据长度后,取最后6个字节,从 (Len-6)位开始拷贝.拷贝6位.
    通过NSData *mac = [NSData dataWithBytes:macData length:6];我们将获取到的 char 还原成了 data

    void* malloc(size_t size)
    malloc 向系统申请分配指定size个字节的内存空间。返回类型是 void* 类型。void* 表示未确定类型的指针。C,C++规定,void* 类型可以强制转换为任何其它类型的指针。

    memset()  
    1.将已开辟内存空间 s 的首 n 个字节的值设为值 c。
    2.memset() 函数常用于内存空间初始化。如 char str[100]; memset(str,0,100);

    void *memcpy(void *dest, const void *src, size_t n);
    memcpy 函数用于 把资源内存(src所指向的内存区域) 拷贝到目标内存(dest所指向的内存区域);拷贝多少个?有一个size变量控制

    strcpy
    C语言标准库函数strcpy,把从src地址开始且含有'\0'结束符的字符串复制到以dest开始的地址空间
    功能:把从src地址开始且含有NULL结束符的字符串复制到以dest开始的地址空间
    说明:src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。
    返回指向dest的指针

    memcpy(macData, _bytes + (len-6), 6);
    

    开始拷贝
    把_bytes 里面的数据考到 macData 里. 从 (Len-6)位开始拷贝.拷贝6位.
    加号代表从多少位开始拷贝.


    
        NSString *ret = nil;
    //mac 可以判断是不是有值,避免空值的情况.
        if(mac != nil){
    
            int index = 0;
    
            while (index < 6) {
    
                if (ret != nil){
    
                    ret = [NSString stringWithFormat:@"%@:",ret];
    
                }
    
                if (ret == nil) {
    
                    ret = [NSString stringWithFormat:@"%02x", macData[index]];
    
                }else {
    
                    ret =[NSString stringWithFormat:@"%@%02x",ret, macData[index]];
    
                }
                index++;
            }
        }
    

    解析

    把每一个字节转换成了16进制.这样获取了 mac 地址

    %02X X 表示以十六进制形式输出,02 表示不足两位,前面补0输出;出过两位,不影响
    举例:
    printf("%02X", 0x123); //打印出:123
    printf("%02X", 0x1); //打印出:01



    大小端转换代码

    字节翻转.
    //字节翻转即:第一个和第四个交换,第二个和第三个交换
    #include<Windows.h>
    #include<stdio.h>
    int main()
    {
        BYTE byte_1,byte_2,byte_3,byte_4;
        unsigned int result;
        //value,int类型 占4个字节,32位
        int value=306382034;//转成16进制就是0x12 43 04 d2
        byte_1=(value&0xff000000)>>24;
        byte_2=(value&0x00ff0000)>>16;
        byte_3=(value&0x0000ff00)>>8;
        byte_4=value&0x000000ff;
    /*
    拼装字节.
    */
        result=(byte_4<<24)+(byte_3<<16)+(byte_2<<8)+byte_1;
        return 0;
    }
    
    
    简单的写法
    void convertToLittleEndian(unsigned int *data, int len)
    {
        for (int index = 0; index < len; index ++) {
            
            *data = ((*data & 0xff000000) >> 24)
            | ((*data & 0x00ff0000) >>  8)
            | ((*data & 0x0000ff00) <<  8)
            | ((*data & 0x000000ff) << 24);
            
            data ++;
        }
    }
    

    知识点

    什么是大端/小端模式

    1. 在各种计算机体系结构中,对于字节、字等的存储机制有所不同,因而引发了计算机通信领域中一个很重要的问题,即通信双方交流的信息单元(比特、字节、字、双字等等)应该以什么样的顺序进行传送。如果不达成一致的规则,通信双方将无法进行正确的编/译码从而导致通信失败。
      字节序,顾名思义字节的顺序,再多说两句就是大于一个字节类型的数据在内存中的存放顺序(一个字节的数据当然就无需谈顺序的问题了)。
      1. 16位的处理器,一次能处理16bit的数据(2byte). 寄存器的宽度就是大于一个字节.那么就要考虑如何存储多字节的问题.
        0x1122(2byte = 4个16进制数)
        0x11为高字节, 0x22为低字节
        在内存中,地址由小到大.内存中的地址若为0x0010
        对于 大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反。

      2. 32位的处理器一次能处理32bit的数据(2byte).
        0x1234 5678
        前面的0x1234 为高字节 0x5678为低字节
        而其中0x12位高字节,34为低字节
        小端模式下,先存低字节 所以先存 0x5678.而0x5678中的低字节先存就是
        0x7856 同理另外一边 0x3412
        结果就是0x7856 3412

    这里有两个概念,"内存中的高地址和低地址","数据的高字节和低字节".

    1. "内存中的高地址和低地址",

    高地址和低地址
    在内存中,地址由小到大.内存中的地址
    低地址 -----------------> 高地址

    2. "数据的高字节和低字节".

    如果我们有一个32位无符号整型0x12345678,那么高位是什么,低位又是什么呢?其实很简单。在十进制中我们都说靠左边的是高位,靠右边的是低位,在其他进制也是如此。就拿 0x12345678来说,从高位到低位的字节依次是0x12、0x34、0x56和0x78。就是换成是二进制数也是一样的.
    0x12345678:
    高字节 ————————> 低字节
    0x12、0x34、0x56和0x78

    1. Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
    2. Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
      举一个例子,比如数字0x12 34 56 78在内存中的表示形式为:
      1)大端模式:

    低地址 -----------------> 高地址
    0x12 | 0x34 | 0x56 | 0x78
    2)小端模式:

    低地址 ------------------> 高地址
    0x78 | 0x56 | 0x34 | 0x12
    可见,大端模式和字符串的存储模式类似。

    代码解析

     //value(int类型,占4个字节)
    int value=306382034;//转成16进制就是0x12 43 04 d2
    //获取数据从高位到地位的每一个字节.
    byte_1=(value&0xff000000)>>24; 
    byte_2=(value&0x00ff0000)>>16;
    byte_3=(value&0x0000ff00)>>8;
    byte_4=value&0x000000ff;
    
    /*
    拼装字节.
    //第一个字节移动到最后一个
    //第二个字节移动到第三个
    //把第三个移动到第二个
    //把最后一个移动到第一个
    */
        result=(byte_4<<24)+(byte_3<<16)+(byte_2<<8)+byte_1;
    

    & 位运算

    计算的时候按位计算,&两边操作数对应位上全为1时,结果的该位值为1。否则该位值为0
    例如:
    0x12&0x23 转为二进制为:
    B00010010&B00100011,
    按位计算结果为B00000010,
    即结果为0x02。

    >>,<< 左右位移符号

    把数字类型转换为2进制,>>2就是左移3位,缺位补零. <<2就是右移2位,也是缺位补零.
    例如:14 >> 2 值等于3
    因为14(即二进制的00001110)向右移两位等于3(即二进制的00000011)说白了,就是把要移动的数转换成2进制,右移几位就去掉右边的几位数,左移几位就在右边加几个0
    例如:14<<2的值为56

    (value&0xff000000) 进行&位运算后,相当于去掉后面24位.只保留1个字节(前8bit)
    (value&0xff000000)>>24 把第一个 byte 字节,向后移动24位.这样我们就把第一个字节移动到了最后一个.获取到了这个字节.


    总结

    什么是数据类型?
    使用编程语言进行编程时,需要用到各种变量来存储各种信息。变量实际上就是一个指针,保留的是它所存储的值的内存位置。这意味着,当您创建一个变量时,就会在内存中保留一些空间。

    我们可能需要存储各种数据类型(比如字符型、宽字符型、整型、浮点型、双浮点型、布尔型等)的信息,操作系统会根据变量的数据类型,来分配内存和决定在保留内存中存储什么。

    数据类型里存储的都是数字.值的范围根据类型的不同而不同.在进行字节转换的时候,要时刻抓住内存,和字节的概念.做数据解析的时候,才不会乱.

    字节数据

    32位和64位 CPU 数据类型对比

    image.jpeg

    byte和 char

    byte在java中才有的

    char型是字符型,占2个字节,默认数值'\u0000',取值范围'\u0000'~'\uffff'

    byte是字节型,占1个字节,默认数值0,取值范围-128~127

    byte是属于整数型的,其他整数型还有short(短整型)int(整形),long(长整型)

    uint8_t一般是指无符号8bit整型数,其实就是unsigned char类型。C语言无此类型,需要自己定义,比如:

    typedef unsigned char uint8_t;

    于char类型只相差一个符号,一般可以直接转换:

    char* a = (char*)b;

    uint8_t* b = (uint8_t*)a;

    uint8_t 无符号8bit整型数

    int16_t 有符号16bit整形数

    相关文章

      网友评论

        本文标题:IOS 字符解析.

        本文链接:https://www.haomeiwen.com/subject/bldedxtx.html