美文网首页
正则筛选字数&GBK转码

正则筛选字数&GBK转码

作者: 音吹 | 来源:发表于2016-10-10 10:02 被阅读29次

正则:

    //1.去除Html语句<>
    NSString * preStr1 =@"<([0-9a-zA-Z\"=#:\\/\\.\\_\\-\\?  ])*>|<\\/([0-9a-zA-Z\"=#:\\/\\.\\_\\-\\?  ])*>|<([0-9a-zA-Z\"=#:\\/\\.\\_\\-\\?  ])*\\/>";
    NSString * replacement = @"";
    
    NSRegularExpression *regExp = [[NSRegularExpression alloc] initWithPattern:preStr1
                                                                       options:NSRegularExpressionCaseInsensitive
                                                                         error:nil];
    //替换
    newLengthStr = [regExp stringByReplacingMatchesInString:newLengthStr
                                                 options:NSMatchingReportProgress
                                                   range:NSMakeRange(0, newLengthStr.length)
                                            withTemplate:replacement];

  • 用到的正则:1.特殊符号
"/(?<=[^x00-xff!…“”《》—、’])( | )(?=[^x00-xff!…""《》-、'])/"
  • 2.\r\n 如果连续大于3个的情况
"(\r\n){3,}"

根据GBK计算长度

    //GBK转码
    NSStringEncoding gbkEncoding = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
    NSData *data=[newLengthStr dataUsingEncoding:gbkEncoding];
    NSInteger length = 0;
    if (data.length % 2 == 0) {
        length = data.length /2;
    }else{
        length = data.length /2 + 1;
    }

相关文章

  • 正则筛选字数&GBK转码

    正则: 用到的正则:1.特殊符号 2.\r\n 如果连续大于3个的情况 根据GBK计算长度

  • 获取地址栏的参数

    正则筛选参数以及转码 函数调用

  • 解决Xcode中文乱码及GBK转码问题

    数组乱码 字典乱码 GBK转码

  • NodeJS GBK转码

    在扒一个网页的数据,网页上有这个charset=GBK,拿到的数据中中文是乱码。判断要把GBK转回来。 原来的代码...

  • 正则筛选

    前言 本篇用于记录常用或好用的正则匹配方法 正文 字符串快速进行多个匹配获取: 判断是否ie浏览器并且小于多少版本...

  • 网页设计 - 收藏集 - 掘金

    免费且又精致的 HTML/CSS 站点模板 - 前端 - 掘金&amp;amp;amp;amp;amp;l...

  • 常用文件处理方法

    GBK格式内容转码 获取文件路径或文件名 hadoop mr 中使用如下方式 spark 中 获取文件名中的ip信...

  • 批量转码-GBK转UTF-8

    使用Xcode查看代码时出现乱码问题,将代码转换成UTF-8格式就可以了。下面是转换脚本,方便以后查看。

  • 字符编码与转码

    字符编码与转码 ASCII(只能存英文或特殊字符占1个字节8位)-GB2312-GBK(向下兼容GB2312)-U...

  • grunt运行时,scss文件报编码错误

    sass文件为GBK编码时,运行grunt会有警告,导致页面报错。解决方法: 可将文件统一转码为utf-8 在ru...

网友评论

      本文标题:正则筛选字数&GBK转码

      本文链接:https://www.haomeiwen.com/subject/quimyttx.html