美文网首页
iOS字符串中去除\xed\xa0\xbc

iOS字符串中去除\xed\xa0\xbc

作者: 大大东 | 来源:发表于2022-04-09 21:03 被阅读0次

最近开业务迭代中,QA发现一个崩溃,在输入各种emoji表情后,点击发送会崩溃。
通过对crash日志分析,发现崩溃在堆栈如下图,在imSDK内部,最后一个函数是对字符串取长度,而一般此函数当字符串为null时会出现异常。

image.png
排查

经过多次代码确认,传递给imSDK一定是有效的字符串,可能是imSDK后续进行了编码,编码失败得到了null,而imSDK内部没有做相应容错,因此只能从上层排查问题并修复。

多次观察QA的操作录屏,发现崩溃前最后输入内容中有类似字母A的奇怪符号 image.png

在emoji表情并不能找到这个符号,正常也无法输入这个表情,怀疑是字数限制截取子串时,截断了一个表情的完整编码,但取消截断代码依然会出现。
再次观察操作录屏,发现一个奇怪的字符串选中现象如下图,第一个表情好像选中了, 又好像没选中...,而这个文字选中区域是双击屏幕时,系统自动选定的。

// 把下列内容粘贴到UITextView,双击“哦哦哦“这三个字的区域,系统就会选中最后一个表情的一半
// 经测试,在微信里也是会出现,但是不会崩溃,只是消息永远发送失败
😍🤬🤬🌫🤬🤬🤬🌫🌫🤬🌫🌫🤬哦哦哦
image.png

调试发现,上图这时点击粘贴替换部分文字,输入内容在控制台打印就多出了\xed\xa0\xbc 这几个奇怪的字符如下图,并且无法转换为UTF8编码。

image.png
解决

通过分析,应该是系统在选中字符时,选中了半个emoji,导致粘贴后,emoji编码变的不完整。
不完整的emoji在Unicode(utf16)时正常,但转码为utf8时会失败。
方案主要有两个,要么最后提交时剔除异常编码字符,要么在输入时就避免出现表情割裂,经测试下列两个方案均可解决问题。

  1. 修改选中范围,避免表情选中不完整(推荐)
// 当选中不完整时,自动修复选中区域
- (void)textViewDidChangeSelection:(UITextView *)textView {
    NSRange selRange = textView.selectedRange;
    
    if (selRange.length > 0) {
        NSInteger locationIdx = selRange.location;
        NSInteger endIdx = MAX(0, (selRange.location + selRange.length - 1));
        
        NSRange beginCharComposedRange = [textView.text rangeOfComposedCharacterSequenceAtIndex:locationIdx];
        NSInteger beginCharIndex = beginCharComposedRange.location;
        
        NSRange endCharComposedRange = [textView.text rangeOfComposedCharacterSequenceAtIndex:endIdx];
        NSInteger endCharIndex = MAX(0, (endCharComposedRange.location + endCharComposedRange.length - 1));
        
        BOOL needReset = NO;
        if (locationIdx != beginCharIndex) {
            locationIdx = beginCharIndex;
            needReset = YES;
        }
        if (endIdx != endCharIndex) {
            endIdx = endCharIndex;
            needReset = YES;
        }
        if (needReset && endIdx >= locationIdx) {
            textView.selectedRange = NSMakeRange(locationIdx, endIdx - locationIdx + 1);
        }
    }
}
  1. 输入完成后&提交前,剔除异常字符

- (NSString *)repairInputText:(NSString *)sendText {
    
    NSMutableString *newmstr = [NSMutableString stringWithCapacity:sendText.length];
    [sendText enumerateSubstringsInRange:NSMakeRange(0, sendText.length)
                                 options:NSStringEnumerationByComposedCharacterSequences
                              usingBlock:^(NSString * _Nullable substring, NSRange substringRange, NSRange enclosingRange, BOOL * _Nonnull stop) {
        
        NSString *utf8encode = [[NSString alloc] initWithData:[substring dataUsingEncoding:NSUTF8StringEncoding]
                                                     encoding:NSUTF8StringEncoding];
        if (utf8encode.length == 0) {
            NSLog(@"---=:char-> len: %d, %@", (int)substring.length, substring);
            NSLog(@"---=: 编码异常字符");
            return;
        }
        [newmstr appendString:substring];
    }];
    return newmstr;
}

相关文章

  • iOS字符串中去除\xed\xa0\xbc

    最近开业务迭代中,QA发现一个崩溃,在输入各种emoji表情后,点击发送会崩溃。通过对crash日志分析,发现崩溃...

  • scrapy | scrapy 和 requests分别对re

    内容涉及中文时乱码类似:“\xe6\x80\xa7\xe4\xbc\xa0”scrapy 直接对字符串解码 req...

  • 爬虫常用代码

    去除字符串中的空值 &\xa0。 爬虫时防止IP访问限制 查看IP是否可用 获取 西刺 随机IP 获取 快代理 I...

  • 【iOS】去除字符串首尾空格或某字符

    在iOS的实际开发中,常会出现需要去除空格的情况,总结有三种情况: 去除字符串首尾连续字符(如空格); 去除字符串...

  • JS常用正则

    1.去除字符串中的空格 str.replace(/[ ]/g,""); //去除字符串中的空格 2.去除字符串前后...

  • js中对字符串(String)去除空格

    js中对字符串(String)去除空格 str为要去除空格的字符串:去除所有空格:str = str.re...

  • python字符串列表小知识

    去除列表中的空字符串 列表中的字符串拼接 字符串中去除空格(例子中mylist为str类型,上述已打印类型) 分割...

  • 小技巧随笔

    js中给字符串添加空格 使用 +'\xa0'+ 即可 超出文本框宽度变为... text-overflow:ell...

  • js去除字符串中的逗号

    js去除字符串中的逗号

  • ArrayList的小练习

    需求:将集合中相同的东西去除掉 ArrayList去除集合中字符串的重复值(字符串的内容相同) 分析:A:创建集合...

网友评论

      本文标题:iOS字符串中去除\xed\xa0\xbc

      本文链接:https://www.haomeiwen.com/subject/jyxmsrtx.html