linux下字符编码转换

作者: 星夜兼程工作笔记 | 来源:发表于2019-09-27 16:10 被阅读0次

#include <iostream>

#include <string>

#include <iconv.h>

using namespace std;

//编码转换，source_charset是源编码，to_charset是目标编码

std::string code_convert(char *source_charset, char *to_charset, const std::string& sourceStr) //sourceStr是源编码字符串

{

iconv_t cd = iconv_open(to_charset, source_charset); //获取转换句柄，void*类型

if (cd == 0)

return "";

size_t inlen = sourceStr.size();

size_t outlen = 255;

char* inbuf = (char*)sourceStr.c_str();

char outbuf[255]; //这里实在不知道需要多少个字节，这是个问题

//char *outbuf = new char[outlen]; 另外outbuf不能在堆上分配内存，否则转换失败，猜测跟iconv函数有关

memset(outbuf, 0, outlen);

char *poutbuf = outbuf; //多加这个转换是为了避免iconv这个函数出现char(*)[255]类型的实参与char**类型的形参不兼容

if(iconv(cd, &inbuf, &inlen, &poutbuf, &outlen) == -1)

return "";

std::string strTemp(outbuf); //此时的strTemp为转换编码之后的字符串

iconv_close(cd);

return strTemp;

}

//gbk转UTF-8

std::string GbkToUtf8(const std::string& strGbk)// 传入的strGbk是GBK编码

{

return code_convert("gb2312", "utf-8", strGbk);

}

//UTF-8转gbk

std::string Utf8ToGbk(const std::string& strUtf8)

{

return code_convert("utf-8", "gb2312", strUtf8);

}

//gbk转unicode,"UCS-2LE"代表unicode小端模式

std::string GbkToUnicode(const std::string& strGbk)// 传入的strGbk是GBK编码

{

return code_convert("gb2312", "UCS-2LE", strGbk);

}

//unicode转gbk

std::string UnicodeToGbk(const std::string& strGbk)// 传入的strGbk是GBK编码

{

return code_convert("UCS-2LE", "gb2312", strGbk);

}

int main()

{

string strUnicode = GbkToUnicode("我"); //转成unico

string strUtf8 = GbkToUtf8("海信"); //转成utf8编码

return 0;

}

网友评论

本文标题：linux下字符编码转换

本文链接：https://www.haomeiwen.com/subject/rylauctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

linux下字符编码转换

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读