美文网首页
iOS中解码.txt文件在UIWebView出现中文乱码的问题

iOS中解码.txt文件在UIWebView出现中文乱码的问题

作者: rectinajh | 来源:发表于2016-07-05 17:03 被阅读2462次

1,什么是gbk和utf-8编码?
2,GBK与UTF-8的区别?

1,GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

2,GBK包含全部中文字符;
UTF8是国际编码,它的通用性比较好,UTF-8则包含全世界所有国家需要用到的字符。
GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~

GB2312是GBK的子集,GBK是GB18030的子集
GBK是包括中日韩字符的大字符集合
支持就能正常观看你的文字而不会出现乱码。

用UIWebview打开txt文件有时候会出现乱码的情况,这种情况应该是txt的编码问题,解决方案如下:

webview打开网页有这三个方法:

- (void)loadRequest:(NSURLRequest *)request;
- (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;
- (void)loadData:(NSData *)data MIMEType:(NSString *)MIMEType textEncodingName:(NSString *)textEncodingName baseURL:(NSURL *)baseURL;

baseUrl是什么?
也就是data中有一些链接是图片,css都是外部文件,然后这些文件需要到一个目录上去找。baseUrl就是这个目录。

1,设置baseUrl
NSArray *paths = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES);
NSString *documentsDir = [paths objectAtIndex:0] ;
//根据自己的具体情况设置,我的html文件在document目录,链接也是在这个目录上开始
NSURL *baseUrl = [NSURL fileURLWithPath:documentsDir];

2,MIMEType的黑魔法?
既文件的指定类型。

UTI和MIME的概念


uti.png

同一类型标识符(Uniform Type Identifier,UTI)代表IOS信息共享的中心组件。可以把它看成下一代的MIME类型。UTI是标识资源类型(比如图像和文本)的字符串,他们制定哪些类型的信息将用于公共数据对象,他们不需要依赖于老式的指示符,比如文件扩展名,MIME类型,或者文件类型的元数据。

MIME(Multipurpose Internet Mail Extensions)多用途互联网邮件扩展类型。是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动使用指定应用程序来打开。多用于指定一些客户端自定义的文件名,以及一些媒体文件打开方式。

  //后缀名字符串转化为UTI字符串
   CFStringRef UTI =         UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);

  //使用UITypeCopyPreferredTagWithClass(),是UTI字符串转化为后缀扩展名,这里是转换UTI字符串转化为MIME类型
   CFStringRefmimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);

  //释放
            CFRelease(UTI);
            CFBridgingRelease(mimeType);

3,编码类型(textEncodingName)
@"GBK" 既gbk编码方式
@"utf-8" 既utf-8编码方式

前两种方法实现中文解码如下:
- (void)loadRequest:(NSURLRequest *)request;
- (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;

txt分带编码和不带编码两种,带编码的如UTF-8格式txt,不带编码的如ANSI格式txt。带编码的用NSString的stringWithContentsOfFile可读出,不带的,我们依次尝试GBK和GB18030编码。

          NSStringEncoding *useEncoding = nil;
          NSString *urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:useEncoding error:nil];

  //按gbk的方式解码;
          if (urlString) {
          urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:0x80000632 error:nil];
}  
    if (urlString) {
    //将解码的贴到webview上
          [self.previewWebView loadHTMLString:urlString baseURL:nil];
} else {
    //如果gbk解码不成功,尝试utf-8解码,NSUTF8StringEncoding
          urlString = [urlString stringByAddingPercentEscapesUsingEncoding:0x80000632];
          NSURL *requesurl = [NSURL URLWithString:urlString];
          NSURLRequest *request = [NSURLRequest requestWithURL:requesurl];
    //用第一种方式加载
          [self.previewWebView loadRequest:request];
}


            第三种方式:
                //同一类型标识符
        CFStringRef UTI =   UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);
        CFStringRef mimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);
        CFRelease(UTI);
        CFBridgingRelease(mimeType);

          //GBK解码
          [self.previewWebView loadData:previewData MIMEType:(__bridge NSString *)(mimeType) textEncodingName:@"GBK" baseURL:nil];

iOS中utf-8国际通用编码有时会出现乱码情况,用gbk国家编码可以很好支持中文编码。
如果应用在国内gbk编码的方式基本通用,但是国外受环境限制易造成乱码,utf全球通用有时会出现本地支持不好情况;

出现乱码的原因在于使用编码的不同环节之间支持的编码不一样。

相关文章

网友评论

      本文标题:iOS中解码.txt文件在UIWebView出现中文乱码的问题

      本文链接:https://www.haomeiwen.com/subject/zlbhjttx.html