《CLR via C#》作者Jeffrey Richter的话来说,“不理解【引用类型】和【值类型】区别的程序员将会给代码引入诡异的bug和性能问题(I believe that a developer who misunderstands the difference between reference types and value types will introduce subtle bugs and performance issues into their code.)”。这就要求我们正确理解和使用值类型和引用类型。
C#中数据类型为CTS(Common Type System),包括值类型和引用类型;值类型包含【布尔类型】、【字符型】和【枚举类型】。
枚举类型(enum)是由一组特定常量构成的一组数据结构,是值类型的一种特殊形式,它从System.Enum继承而来,并为基础类型的值提供替代名词。枚举类型有名称、基础类型和一组字段。基础类型必须是内置的整数类型,字段是静态文本字段,其中的每一个字段都表示常数,同一个值可以分配给多个字段,出现这种情况时,必须将其中某个值标记为主要枚举值,以便进行反射和字符串转换。枚举声明可以显式地声明 byte、sbyte、short、ushort、int、uint、long 或 ulong 类型作为对应的基础类型,没有显式地声明基础类型的枚举声明意味着所对应的基础类型是int。
用户可以将基础类型的值分配给枚举,反之亦然(运行库不要求强制转换);也可创建枚举的实例,并调用System.Enum的方法以及对枚举基础类型定义的任何方法。对于枚举还有以下附加限制:
1.枚举不能定义自己的方法
2.枚举不能实现接口
3.枚举不能定义属性或事件
注意点:
1.对于没有赋值的枚举类型,声明的第一个枚举成员它的默值为0,以后的枚举成员值是将前一个枚举成员(按照文本顺序)的值加1得到的。
2.允许多个枚举成员有相同的值。没有显示赋值的枚举成员的值,总是前一个枚举成员的值加1。
3.使用时注意类型转换。
char代表无符号的16位整数,数值范围从0~65535。 char类型的可能值对应于统一字符编码标准(Unicode)的字符集。char类型与其他整数类型相比有以下两点不同之处:
1.没有其他类型到char类型的隐式转换。即使是对于sbyte,byte和ushort这样能完全使用char类型代表其值的类型, sbyte,byte和ushort到char的隐式转换也不存在。
2.char类型的常量必须被写为字符形式,如果用整数形式,则必须带有类型转换前缀。
比如(char)10赋值形式有三种: char chsomechar="A"; char chsomechar="\x0065"; 十六进制 char chsomechar="\u0065 ;
unicode表示法字符型中有下列转义符:
\'用来表示单引号
\"用来表示双引号
\\ 用来表示反斜杠
\0 表示空字符
\a 用来表示感叹号
\b 用来表示退格
\f 用来表示换页
\n 用来表示换行
\r 用来表示回车
\t 用来表示水平tab
\v 用来表示垂直tab
类型说明及范围float类型精确到小数点后面7位。double类型精确到小数点后面15位或16位。decimal关键字表示128位数据类型。同浮点型相比,decimal类型具有更高的精度和更小的范围,这使它适合于财务和货币计算,精确到小数点后面28到29位。
1. 通用类型系统
C#中,变量是值还是引用仅取决于其数据类型。C#的基本数据类型都以平台无关的方式来定义。C#的预定义类型并没有内置于语言中,而是内置于.NET Framework中。.NET使用通用类型系统(CTS)定义了可以在中间语言(IL)中使用的预定义数据类型,所有面向.NET的语言都最终被编译为 IL,即编译为基于CTS类型的代码。
例如,在C#中声明一个int变量时,声明的实际上是CTS中System.Int32的一个实例。这具有重要的意义:
确保IL上的强制类型安全;
实现了不同.NET语言的互操作性;
所有的数据类型都是对象。它们可以有方法,属性,等。例如:
int i;
i = 1;
string s;
s = i.ToString();
MSDN的这张图说明了CTS中各个类型是如何相关的。注意,类型的实例可以只是值类型或自描述类型,即使这些类型有子类别也是如此。
2. 值类型
C#的所有值类型均隐式派生自System.ValueType: 结构体:struct(直接派生于System.ValueType);
数值类型:
整 型:sbyte(System.SByte的别名),short(System.Int16),int(System.Int32),long (System.Int64),byte(System.Byte),ushort(System.UInt16),uint (System.UInt32),ulong(System.UInt64),char(System.Char);
浮点型:float(System.Single),double(System.Double);
用于财务计算的高精度decimal型:decimal(System.Decimal)。
bool型:bool(System.Boolean的别名);
用户定义的结构体(派生于System.ValueType)。
枚举:enum(派生于System.Enum);
可空类型(派生于System.Nullable泛型结构体,T?实际上是System.Nullable的别名)。
每种值类型均有一个隐式的默认构造函数来初始化该类型的默认值。例如:
int i = new int();
等价于:
Int32 i = new Int32();
等价于:
int i = 0;
等价于:
Int32 i = 0;
使用new运算符时,将调用特定类型的默认构造函数并对变量赋以默认值。在上例中,默认构造函数将值0赋给了i。MSDN上有完整的默认值表。
所有的值类型都是密封(seal)的,所以无法派生出新的值类型。
值得注意的是,System.ValueType直接派生于System.Object。即System.ValueType本身是一个类类型,而不是值类型。其关键在于ValueType重写了Equals()方法,从而对值类型按照实例的值来比较,而不是引用地址来比较。
可以用Type.IsValueType属性来判断一个类型是否为值类型:
复制代码 代码如下:
TestType testType = new TestType ();
if (testType.GetType().IsValueType)
{
Console.WriteLine("{0} is value type.", testType.ToString());
}
3. 引用类型
C#有以下一些引用类型:
数组(派生于System.Array)
用户定义的以下类型:
类:class(派生于System.Object);
接口:interface(接口不是一个“东西”,所以不存在派生于何处的问题。Anders在《C# Programming Language》中说,接口只是表示一种约定[contract]);
委托:delegate(派生于System.Delegate);
object:(System.Object的别名);
字符串:string(System.String的别名)。
可以看出:
引用类型与值类型相同的是,结构体也可以实现接口;
引用类型可以派生出新的类型,而值类型不能;
引用类型可以包含null值,值类型不能(可空类型功能允许将 null 赋给值类型);
引用类型变量的赋值只复制对对象的引用,而不复制对象本身。而将一个值类型变量赋给另一个值类型变量时,将复制包含的值。
对于最后一条,经常混淆的是string。我曾经在一本书的一个早期版本上看到String变量比string变量效率高;我还经常听说String是引用类型,string是值类型,等等。例如:
string s1 = "Hello, ";
string s2 = "world!";
string s3 = s1 + s2; //s3 is "Hello, world!"
这确实看起来像一个值类型的赋值。再如:
string s1 = "a";
string s2 = s1;
s1 = "b"; //s2 is still "a"
改变s1的值对s2没有影响。这更使string看起来像值类型。实际上,这是运算符重载的结果,当s1被改变时,.NET在托管堆上为s1重新分配了内存。这样的目的,是为了将做为引用类型的string实现为通常语义下的字符串。
4. 值类型和引用类型在内存中的部署
经常听说,并且经常在书上看到:值类型部署在栈上,引用类型部署在托管堆上。实际上并没有这么简单。
MSDN上说:托管堆上部署了所有引用类型。这很容易理解。当创建一个应用类型变量时:
object reference = new object();
关键字new将在托管堆上分配内存空间,并返回一个该内存空间的地址。左边的reference位于栈上,是一个引用,存储着一个内存地址;而这个地址指向的内存(位于托管堆)里存储着其内容(一个System.Object的实例)。下面为了方便,简称引用类型部署在托管推上。
再来看值类型。《C#语言规范》 上的措辞是“结构体不要求在堆上分配内存(However, unlike classes, structs are value types and do not require heap allocation)”而不是“结构体在栈上分配内存”。这不免容易让人感到困惑:值类型究竟部署在什么地方?
5. 正确使用值类型和引用类型
这一部分主要参考《Effective C#》,希望能让你加深对值类型和引用类型的理解。
C#中,变量是值还是引用仅取决于其数据类型。
C#的值类型包括:结构体(数值类型,bool型,用户定义的结构体),枚举,可空类型。
C#的引用类型包括:数组,用户定义的类、接口、委托,object,字符串。
数组的元素,不管是引用类型还是值类型,都存储在托管堆上。
引用类型在栈中存储一个引用,其实际的存储位置位于托管堆。为了方便,本文简称引用类型部署在托管推上。
值类型总是分配在它声明的地方:作为字段时,跟随其所属的变量(实例)存储;作为局部变量时,存储在栈上。
值类型在内存管理方面具有更好的效率,并且不支持多态,适合用作存储数据的载体;引用类型支持多态,适合用于定义应用程序的行为。
应该尽可能地将值类型实现为具有【常量性】和【原子性】的类型。
应该尽可能地确保0为值类型的有效状态。
应该尽可能地减少装箱和拆箱。
网友评论