美文网首页
linux下字符编码转换

linux下字符编码转换

作者: 星夜兼程工作笔记 | 来源:发表于2019-09-27 16:10 被阅读0次

    #include <iostream>

    #include <string>

    #include <iconv.h>

    using namespace std;

    //编码转换,source_charset是源编码,to_charset是目标编码

    std::string code_convert(char *source_charset, char *to_charset, const std::string& sourceStr) //sourceStr是源编码字符串

    {

    iconv_t cd = iconv_open(to_charset, source_charset); //获取转换句柄,void*类型

    if (cd == 0)

    return "";

    size_t inlen = sourceStr.size();

    size_t outlen = 255;

    char* inbuf = (char*)sourceStr.c_str();

    char outbuf[255]; //这里实在不知道需要多少个字节,这是个问题

    //char *outbuf = new char[outlen]; 另外outbuf不能在堆上分配内存,否则转换失败,猜测跟iconv函数有关

    memset(outbuf, 0, outlen);

    char *poutbuf = outbuf;  //多加这个转换是为了避免iconv这个函数出现char(*)[255]类型的实参与char**类型的形参不兼容

    if(iconv(cd, &inbuf, &inlen, &poutbuf, &outlen) == -1)

    return "";

    std::string strTemp(outbuf); //此时的strTemp为转换编码之后的字符串

    iconv_close(cd);

    return strTemp;

    }

    //gbk转UTF-8 

    std::string GbkToUtf8(const std::string& strGbk)// 传入的strGbk是GBK编码

    {

    return code_convert("gb2312", "utf-8", strGbk);

    }

    //UTF-8转gbk

    std::string Utf8ToGbk(const std::string& strUtf8)

    {

    return code_convert("utf-8", "gb2312", strUtf8);

    }

    //gbk转unicode,"UCS-2LE"代表unicode小端模式

    std::string GbkToUnicode(const std::string& strGbk)// 传入的strGbk是GBK编码

    {

    return code_convert("gb2312", "UCS-2LE", strGbk);

    }

    //unicode转gbk

    std::string UnicodeToGbk(const std::string& strGbk)// 传入的strGbk是GBK编码

    {

    return code_convert("UCS-2LE", "gb2312", strGbk);

    }

    int main()

    {

    string strUnicode = GbkToUnicode("我"); //转成unico

    string strUtf8  = GbkToUtf8("海信"); //转成utf8编码 

    return 0;

    }

    相关文章

      网友评论

          本文标题:linux下字符编码转换

          本文链接:https://www.haomeiwen.com/subject/rylauctx.html