美文网首页
(转)服务端返回NSData转NSString返回nil

(转)服务端返回NSData转NSString返回nil

作者: 文子飞_ | 来源:发表于2020-08-18 17:22 被阅读0次

    iOS开发中,比较蛋疼的一个问题,NSData转UTF-8格式的NSString,有时候会返回nil。

    究其原因,无非就是:UTF-8的字符中混进了其他编码格式的字符,这样NSData转NSString的时候,就是返回nil

    而现在网上的方法基本就这几个:

    http://blog.csdn.net/cuibo1123/article/details/40938225
    http://blog.csdn.net/xocom/article/details/50905578
    http://www.cnblogs.com/xiao-love-meng/p/5757564.html

    这几个方法都不完美,都不能完全解决我遇到的问题。

    我的解决方法:

    查了UTF-8的wiki,utf-8的编码格式如下,理论上可以到6个字节,但之用到了4个字节。

    image

    其中,有一些特殊字节是不会出现在utf-8中的:

    image

    其中,还指出了判断utf-8的方法:

    UTF-8字符串可以由一个简单的算法可靠地识别出来。就是,一个字符串在任何其它编码中表现为合法的UTF-8的可能性很低,并随字符串长度增长而减小。举例说,字符值C0,C1,F5至FF从来没有出现。为了更好的可靠性,可以使用正则表达式来统计非法过长和替代值(可以查看W3 FAQ: Multilingual Forms上的验证UTF-8字符串的正则表达式)。

    $field =~
      m/\A(
         [\x09\x0A\x0D\x20-\x7E]            # ASCII
       | [\xC2-\xDF][\x80-\xBF]             # non-overlong 2-byte
       |  \xE0[\xA0-\xBF][\x80-\xBF]        # excluding overlongs
       | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}  # straight 3-byte
       |  \xED[\x80-\x9F][\x80-\xBF]        # excluding surrogates
       |  \xF0[\x90-\xBF][\x80-\xBF]{2}     # planes 1-3
       | [\xF1-\xF3][\x80-\xBF]{3}          # planes 4-15
       |  \xF4[\x80-\x8F][\x80-\xBF]{2}     # plane 16
      )*\z/x;
    
    

    因此,我们只要把上面的代码,转换成OC语言就行了:
    这里我直接写了一个Category:

    @implementation NSData (UTF8)
    
    - (NSString *)utf8String {
        NSString *string = [[NSString alloc] initWithData:self encoding:NSUTF8StringEncoding];
        if (string == nil) {
            string = [[NSString alloc] initWithData:[self replaceNoUtf8:self] encoding:NSUTF8StringEncoding];
        }
        return string;
    }
    
    //替换非utf8字符
    //注意:如果是三字节utf-8,第二字节错误,则先替换第一字节内容(认为此字节误码为三字节utf8的头),然后判断剩下的两个字节是否非法;
    - (NSData *)replaceNoUtf8:(NSData *)data
    {
        char aa[] = {'A','A','A','A','A','A'};                      //utf8最多6个字符,当前方法未使用
        NSMutableData *md = [NSMutableData dataWithData:data];
        int loc = 0;
        while(loc < [md length])
        {
            char buffer;
            [md getBytes:&buffer range:NSMakeRange(loc, 1)];
            if((buffer & 0x80) == 0)
            {
                loc++;
                continue;
            }
            else if((buffer & 0xE0) == 0xC0)
            {
                loc++;
                [md getBytes:&buffer range:NSMakeRange(loc, 1)];
                if((buffer & 0xC0) == 0x80)
                {
                    loc++;
                    continue;
                }
                loc--;
                //非法字符,将这个字符(一个byte)替换为A
                [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
                loc++;
                continue;
            }
            else if((buffer & 0xF0) == 0xE0)
            {
                loc++;
                [md getBytes:&buffer range:NSMakeRange(loc, 1)];
                if((buffer & 0xC0) == 0x80)
                {
                    loc++;
                    [md getBytes:&buffer range:NSMakeRange(loc, 1)];
                    if((buffer & 0xC0) == 0x80)
                    {
                        loc++;
                        continue;
                    }
                    loc--;
                }
                loc--;
                //非法字符,将这个字符(一个byte)替换为A
                [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
                loc++;
                continue;
            }
            else
            {
                //非法字符,将这个字符(一个byte)替换为A
                [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
                loc++;
                continue;
            }
        }
        
        return md;
    }
    
    
    @end
    

    JSON格式数据,前面多了垃圾字符截取处理。
    A{"commandType":"PLAYER_INFO","commandId":"0e752a6a-efaf-4e71-a970-b8d491170538","parameter":{"balance":0,"nickname":"","returnMessage":0,"currency":"TEST","userName":"18617024050","playerId":38795}}

    messageData = [messageData replaceNoUtf8:messageData];
        
        NSError *err;
        NSString *messageString = [[NSString alloc] initWithData:messageData encoding:NSUTF8StringEncoding];
        messageString = [messageString stringByReplacingOccurrencesOfString:@"\0\0\0" withString:@""];
        
        BOOL hasPrefix = NO;
        while (hasPrefix == NO) {
            messageString = [messageString substringFromIndex:1];
            hasPrefix = [messageString hasPrefix:@"{"];
        }
        
        NSData *utf8Data = [messageString dataUsingEncoding:NSUTF8StringEncoding];
        NSDictionary *jsonDic = [NSJSONSerialization JSONObjectWithData:utf8Data options:NSJSONReadingAllowFragments error:&err];
        if (err) {
            NSLog(@"err = %@", err);
        }
        
        NSLog(@"收到服务器返回消息messageString:%@",messageString);
        NSLog(@"收到服务器返回消息jsonDic:%@", jsonDic);
    

    相关文章

      网友评论

          本文标题:(转)服务端返回NSData转NSString返回nil

          本文链接:https://www.haomeiwen.com/subject/vjukjktx.html