第2章 数据库初探
什么是实体(Entity)?一个实体是现实世界客观存在的一个事物。可具体可抽象。实体由它们自己的属性值表示其特征。实体分为强实体和弱实体。
实体集:结构和特性相同的实体组成的集合称为实体集。如,大一年级全部班集体等。
实体类型:描述实体集的信息结构,通常包括类型名和实体的属性名集合。例如,学生(学号,姓名,性别,年龄,班级)。
什么是属性:描述实体或联系的特性。实体的每个特性称为一个属性。属性有属性名、属性类型、属性定义域和属性值之分。
实体标识(码或键):其值能唯一地标识每个实体的属性集称为实体的标识。在关系数据库中实体的标识称为码或键,其标识码是实体的单个属性或属性子集的值。
什么是联系:现实世界中,事物之间的相互联系是客观存在的,联系反映实体间的相互关系。这种联系必然要在信息世界中进行描述。而且,联系除用作属性外,联系本身也可以有属性值。例如,每个教师隶属一个研究所,每个教师和其隶属的一个研究所之间有一个隶属联系。
联系集:实体间相同类型的联系也构成联系集合。例如,多个教师和他们隶属的研究所之间就形成隶属联系集。
联系类型:描述具有共同特性的实体之间联系集的信息结构,通常包括联系的类型名、联系的属性等。
数据库应用程序接口API(Application Programming Interface):是由DBMS为开发应用程序提供的操纵和访问数据库中数据的接口函数、过程或语言。
数据库应用程序AP(Application Program):满足某类用户要求的操纵和访问数据库的程序。
数据仓库(Data Warehouse):一个数据仓库就是一个自带数据库的商业应用系统。利用现有的数据资源,把数据转换为信息,从中挖掘出知识,提炼成智慧,创造出效益。
数据发掘(Data Mining):数据发掘可帮助商业用户处理大量存在的数据,以期发现一些"意外的关系",以便增加市场份额和利润。
信息发掘(Information Mining):信息发掘是指在文档、地图、照片、声音和影像之汪洋大海中发现相关信息,即面向内容的检索。
数据模式(Data Model):在数据库中,对数据(实体)的描述称为数据库模式。用相应的模式定义语言来描述。
数据模型(Data Model):是对现实世界特征的数字化的模拟和抽象。
字段( Field):层次数据模型中数据的最小单位,描述实体的属性。
片段(Segment):是IMS层次数据模型中描述实体的单位,由字段集合组成的记录。也是应用程序访问数据库数据的单位。
数据项(Data Item):是DBTG命名的网状数据模型中的最小数据单位, 表示实体的属性。
记录(Record ):是DBTG命名的网状数据模型中描述实体的单位,是数据项的有序集合。
域(Domain):域是值的集合,即值的取值范围。
关系(Relation):一个关系就是一张二维表, 每张表有一个表名。
元组(Tuple):关系表中的一行称为一个元组。元组可表示一个实体或实体之间的联系。
关键字( Primary Key ):表中的一个属性或几个属性的组合、其值能唯一地标识关系中的一个元组。关键字属性不能取空值。
外部关键字(Forgien Key):在一个关系中含有的与另一个关系的关键字相对应的属性组称为该关系的外部关键字。外部关键字取空值或为外部表中对应的关键字值。
网络库(Net-Library):一个通信软件包,对数据库请求和结果打包,由网络协议传送。也称Net-Library,在客户机和服务器上都要安装。
数据库常用模型:1,层次模型:2,网状模型,3,关系模型,4面向对象模型。
数据模型:是用来抽象、表示和处理现实世界中的数据和信息的工具,是对现实世界的模拟,是数据库系统的核心和基础;其组成元素有数据结构、数据操作和完整性约束。
E-R图:即实体-关系图,用于描述现实世界的事物及其相互关系,是数据库概念模型设计的主要工具。
层次模型特点:用一颗“有向树”的数据结构来表示表示各类实体以及实体间的联系,树中每一个节点代表一个记录类型,树状结构表示实体型之间的联系。
网状模型特点:用网络结构表示实体类型及其实体之间联系的模型。
层次模型优缺点:结构清晰,结点间联系简单,只要知道每个结点的双亲结点,就可以知道整个模型结构。但是查询子女结点必须通过双亲结点,因为层次模型对任一结点的所有子树都规定了先后次序,这一限制隐含了对数据库存取路径的控制。
网状模型优缺点:能够更为直接地描述现实客观世界。可表示实体间的多种复杂联系。但是结构比较复杂,其数据定义语言(DDL)、数据操作语言(DML)复杂,用户不容易使用。而且应用环境越大,数据库的结构就变得越复杂,不利于最终用户掌握。
网友评论