美文网首页
iOS字符串中去除\xed\xa0\xbc

iOS字符串中去除\xed\xa0\xbc

作者: 大大东 | 来源:发表于2022-04-09 21:03 被阅读0次

    最近开业务迭代中,QA发现一个崩溃,在输入各种emoji表情后,点击发送会崩溃。
    通过对crash日志分析,发现崩溃在堆栈如下图,在imSDK内部,最后一个函数是对字符串取长度,而一般此函数当字符串为null时会出现异常。

    image.png
    排查

    经过多次代码确认,传递给imSDK一定是有效的字符串,可能是imSDK后续进行了编码,编码失败得到了null,而imSDK内部没有做相应容错,因此只能从上层排查问题并修复。

    多次观察QA的操作录屏,发现崩溃前最后输入内容中有类似字母A的奇怪符号 image.png

    在emoji表情并不能找到这个符号,正常也无法输入这个表情,怀疑是字数限制截取子串时,截断了一个表情的完整编码,但取消截断代码依然会出现。
    再次观察操作录屏,发现一个奇怪的字符串选中现象如下图,第一个表情好像选中了, 又好像没选中...,而这个文字选中区域是双击屏幕时,系统自动选定的。

    // 把下列内容粘贴到UITextView,双击“哦哦哦“这三个字的区域,系统就会选中最后一个表情的一半
    // 经测试,在微信里也是会出现,但是不会崩溃,只是消息永远发送失败
    😍🤬🤬🌫🤬🤬🤬🌫🌫🤬🌫🌫🤬哦哦哦
    
    image.png

    调试发现,上图这时点击粘贴替换部分文字,输入内容在控制台打印就多出了\xed\xa0\xbc 这几个奇怪的字符如下图,并且无法转换为UTF8编码。

    image.png
    解决

    通过分析,应该是系统在选中字符时,选中了半个emoji,导致粘贴后,emoji编码变的不完整。
    不完整的emoji在Unicode(utf16)时正常,但转码为utf8时会失败。
    方案主要有两个,要么最后提交时剔除异常编码字符,要么在输入时就避免出现表情割裂,经测试下列两个方案均可解决问题。

    1. 修改选中范围,避免表情选中不完整(推荐)
    // 当选中不完整时,自动修复选中区域
    - (void)textViewDidChangeSelection:(UITextView *)textView {
        NSRange selRange = textView.selectedRange;
        
        if (selRange.length > 0) {
            NSInteger locationIdx = selRange.location;
            NSInteger endIdx = MAX(0, (selRange.location + selRange.length - 1));
            
            NSRange beginCharComposedRange = [textView.text rangeOfComposedCharacterSequenceAtIndex:locationIdx];
            NSInteger beginCharIndex = beginCharComposedRange.location;
            
            NSRange endCharComposedRange = [textView.text rangeOfComposedCharacterSequenceAtIndex:endIdx];
            NSInteger endCharIndex = MAX(0, (endCharComposedRange.location + endCharComposedRange.length - 1));
            
            BOOL needReset = NO;
            if (locationIdx != beginCharIndex) {
                locationIdx = beginCharIndex;
                needReset = YES;
            }
            if (endIdx != endCharIndex) {
                endIdx = endCharIndex;
                needReset = YES;
            }
            if (needReset && endIdx >= locationIdx) {
                textView.selectedRange = NSMakeRange(locationIdx, endIdx - locationIdx + 1);
            }
        }
    }
    
    1. 输入完成后&提交前,剔除异常字符
    
    - (NSString *)repairInputText:(NSString *)sendText {
        
        NSMutableString *newmstr = [NSMutableString stringWithCapacity:sendText.length];
        [sendText enumerateSubstringsInRange:NSMakeRange(0, sendText.length)
                                     options:NSStringEnumerationByComposedCharacterSequences
                                  usingBlock:^(NSString * _Nullable substring, NSRange substringRange, NSRange enclosingRange, BOOL * _Nonnull stop) {
            
            NSString *utf8encode = [[NSString alloc] initWithData:[substring dataUsingEncoding:NSUTF8StringEncoding]
                                                         encoding:NSUTF8StringEncoding];
            if (utf8encode.length == 0) {
                NSLog(@"---=:char-> len: %d, %@", (int)substring.length, substring);
                NSLog(@"---=: 编码异常字符");
                return;
            }
            [newmstr appendString:substring];
        }];
        return newmstr;
    }
    

    相关文章

      网友评论

          本文标题:iOS字符串中去除\xed\xa0\xbc

          本文链接:https://www.haomeiwen.com/subject/jyxmsrtx.html