美文网首页
ByteType - C++ Builder

ByteType - C++ Builder

作者: 玄坴 | 来源:发表于2021-09-17 16:04 被阅读0次

C++ Builder 参考手册System::SysutilsByteType


字符串里面某个编码单元的类型

头文件:#include <System.SysUtils.hpp>
命名空间:System::Sysutils
函数原型:

TMbcsByteType __fastcall ByteType(const System::AnsiString S, int Index);
TMbcsByteType __fastcall ByteType(const System::UnicodeString S, int Index);

参数:

  • S:字符串;
  • Index:编码单元序号,从 1 开始为第 1 个 char 或 char16_t (或 wchar_t),到 n (假定 n 为字符串 S 的长度)

返回值:

  • 字符串 S 里面第 Index 个 char 或 char16_t (或 wchar_t) 的类型:
    • mbSingleByte 单个编码单元的字符;
    • mbLeadByte 两个编码单元的字符当中前面一个编码单元;
    • mbTrailByte 两个编码单元的字符当中后面一个编码单元;
  • AnsiString 字符串英文字母和符号 1 个字节,是单个编码单元的字符 mbSingleByte ,汉字 2 个字节,是两个编码单元的字符,前面一个字符是 mbLeadByte,后面一个字符是 mbTrailByte;
  • UnicodeString 字符串英文字符、常用的汉字等,是 1 个 char16_t (或 wchar_t),是单个编码单元的字符 mbSingleByte,不常用的汉字、表情符号等,是 2 个 char16_t (或 wchar_t),是两个编码单元的字符,前面一个 char16_t 是 mbLeadByte,后面一个 char16_t 是 mbTrailByte。

例子:这个例子演示了 AnsiString 和 UnicodeString 包含 1 个和 2 个 编码单元的字符的编码单元类型:

template<class T>
UnicodeString EnumToString(T t)
{
    return Typinfo::GetEnumName(__delphirtti(T), (int)t);
}
//---------------------------------------------------------------------------
void __fastcall TForm1::Button1Click(TObject *Sender)
{
    AnsiString s = L"Hello玄坴";
    Memo1->Lines->Add(s);

    int n = s.Length();
    for(int i=1; i<=n; i++)
    {
        Memo1->Lines->Add(IntToStr(i) + L": " + EnumToString(Sysutils::ByteType(s,i)));
    }
}
//---------------------------------------------------------------------------
void __fastcall TForm1::Button2Click(TObject *Sender)
{
    UnicodeString s = L"土𪢴圭垚𡋣㙓";
    Memo1->Lines->Add(s);

    int n = s.Length();
    for(int i=1; i<=n; i++)
    {
        Memo1->Lines->Add(IntToStr(i) + L": " + EnumToString(Sysutils::ByteType(s,i)));
    }
}

运行结果:

运行结果1 运行结果2

相关:


C++ Builder 参考手册System::SysutilsByteType

相关文章

网友评论

      本文标题:ByteType - C++ Builder

      本文链接:https://www.haomeiwen.com/subject/xwpdahtx.html