美文网首页我爱编程程序员
C/C++中的类型转换和字符串处理

C/C++中的类型转换和字符串处理

作者: SK木眠 | 来源:发表于2018-03-04 12:31 被阅读0次

    本篇对C/C++中的字符串处理和类型转换的相关知识总结提高一下,之前对这方面缺乏整体认知和深刻理解,总是出问题比较影响效率和心情。

    一、char*、char[]和string

    在此之前,需要说明一点,所谓”数组==指针”的说法是错误的,虽然不知道这个观点是为何流传甚广的,总之有很多人曾经深受其害(我也是#_#)。

    0. array和pointer

    • 数组长度在编译时确定,而指针则可以动态分配内存(动态数组);

    • 数组元素的地址在编译时就已经确定了,可以直接用,但是指针的地址需要先获取一次,然后才能使用这个地址来进行操作,比之数组操作要多了获取地址的一个步骤。从下图可以看出区别,指针类型赋值时多出了一步获取指针地址的操作mov eax,dword ptr [bar]

      两种类型的赋值反汇编.png
    • 在使用常量赋值时,数组中元素的值存放在栈上,可以直接修改,但指针指向的值存放在堆上,不可以直接修改。栈的开销比堆小,再访问结合上一条区别,数组的效率是要比指针高的;

    • 未确认长度的数组是一种不完整类型(incomplete type),所谓的不完整类型(void type,an array type of unknown size,a structure or union type of unknown content---比如前置声明)是相对于普通的对象类型(object type)而言的,说明它的类型信息是不完备的(types that describe objects but lack information needed to determine their sizes),当然这种情况只会出现于声明时,定义使用时需要初始化;

    • sizeof运算符:用于数组时返回整个数组的元素占用内存的大小,而用于指针、类或结构体、联合体时返回的是类型占用的内存大小,因此注意不要对char*、string使用sizeof运算符

    1. char*和char[]

    • char*是指向字符串的指针,可以更改其指向地址的值也可以更改其指向的地址;
      char[]是字符数组,可以用于保存字符串,可以更改元素的值但不可以更改元素的地址(编译时确定);
    • char[]的存取效率高于char*;
    • char[]的长度是在编译时确定的,无法用于需要不定长度的情况,此时可以用char*来解决。

    2. string

    std::string相比于C的字符串类型优点在于安全易用,代码美观,在不需要细扣效率的时候还是选择string来代替吧,虽然功能不是很丰富,但是在用到其他库的时候一般可以选择各自实现的string类(比如CString、QString等),实在不行自己做一个(

    二、const修饰符

    之前在C++ Primer里有研究过这个东西,个人理解一般const放在被修饰类型的后面(const T例外),只要记住const前面修饰的类型是不可修改的就行了。下面举一个例子:

    int foo = 1;
    //一个int类型常量的常量指针的常量引用
    int const * const & const bar = &foo; //bar is a const &->refer to a const *->point to a const int
    const int * const & const baz = &foo; //baz is a const &->refer to a const *->point to a int that is const
    

    上面这两种写法都是一样的(const int == int const),第一个const修饰int说明值不可修改,第二个const修饰*说明指针不可修改,第三个const修饰&说明引用不可修改。当然这种写法是没什么意义的掉书袋行为,但举这个例子旨在说明一种理解const的方式。[ref:const int = int const?]
    至于const的使用方面,当你需要定义一个常量并且确认它不应当被改变时就加上const修饰符吧,一方面可以防止误用,另一方面也可以给代码的阅读者提供方便。

    三、常用的字符串处理函数

    • 关于长度,除了sizeof运算符计算内存大小(含'\0')之外,C提供了strlen函数用于获取字符串长度,C++ string类提供了length函数用于获取string长度(均不含'\0')。
    • 对于C来说,常用的字符串相关处理函数包括string.h提供的一系列函数str_(strchr,strcmp,strcpy,strcat...还有一些不常用的函数,功能其实比你想象的要多一些),类型转换的一系列函数_to_(atoi,ftoa,ultoa,strtod...这里的a表示ASCII),还有需要着重注意的一个格式化函数sprintf,功能很强大,和printf、fprintf是兄弟:),分别用于输出到字符串、屏幕、文件的不同场景。
      再提一句,在处理C字符串的时候务必多注意缓冲区溢出的问题,可以多用安全函数。
    • C++的std::string和其他语言和库的各种string类就不提了,其成员函数基本都能见名知意,用时根据需求找对应的实现即可。

    四、正则表达式

    嗯....这个感觉没什么好说的,当你开始觉得字符串匹配、提取、处理开始变得复杂而又头疼的时候就该拾起正则表达式了。很多不同的语言和库都有自己的实现,对字符串宝具哦。(另外正则用多了总觉得一碰见字符串处理就想写个正则...
    这里附上一个名为入门其实也可以作为平时用时参考的文章[正则表达式30分钟入门教程]

    五、类型转换

    1.C风格类型转换

    一句话形容就是简单粗暴,通常我们在C中用(new-type)expression这种方式来进行各种类型间显式转换或者在允许的情况下直接隐式转换,但是出于可读性、安全性以及代码复查难易度的考虑,建议摒弃隐式转换的方式(虽然还是不如C++风格)。

    2.C++风格类型转换

    作为一门比较modern的语言,对于类型转换当然要做到优雅而安全,相应的,在C++中出现了适用于不同场景的四种类型转换方式:

    • static_cast<>() & dynamic_cast<>()
      前者是静态类型转换,在编译时检查其合法性,通常是安全的,但在向下转型(downcast)时不保证安全性,当然此时你应当采用后者来进行转换(除非对性能很在意)。
      后者在运行时检查(也是四种类型转换中唯一的运行时检查),用于向下转型,依赖于RTTI信息,不合法时会返回NULL。
      这时候可能会有人问,那向上转型呢?C++中向上转型和向下转型不同,是不需要强制转换的,原因呢,考虑一个问题:“static_cast一定是cast,那cast一定是static_cast吗”?static_cast是子类,cast是父类,子类一定是父类(向上转型是安全的),但父类不一定是子类(向下转型是不安全的)。
    • const_cast<>()
      用于改变const属性,一般来说,在使用const修饰符时的本意就是禁止修改,你可以用它来转化掉const指针与const对象的const属性,但这是违背初衷的,并且对于基础类型的常量应用const_cast是未定义行为,而在函数传参时也可以用static_cast来增加const属性,因此在编程时建议摒弃const_cast。
    • reinterpret_cast<>()
      用于两种类型间的直接映射,是绕过编译器没有任何检查的危险行为,因此只有当你十分确认它没有问题时再使用。

    相关文章

      网友评论

        本文标题:C/C++中的类型转换和字符串处理

        本文链接:https://www.haomeiwen.com/subject/yqcstftx.html