数据库自学日记

作者: TOP蓝兰1997 | 来源:发表于2018-08-23 11:05 被阅读14次

数据库自学日记
Linux常用命令，实战问题合集～
MySQL 自学笔记
手把手SQL快速入门
自学日记
SQL Server基本命令与用法总结
从序列到表达矩阵
2018-09-12yummy工作安排
runtime自学日记
英语自学——日记

1.建立数据仓库不是简单的把企业的各种应用集中在一起，而是利用企业系统生成的数据，以面向主题、集成的方式合理组织数据，解决数据分析应用的性能冲突。

2.数据库应用系统设计包括：

概念设计：采用自下而上的ER设计

逻辑设计：设计视图和关系模式的完整性约束，完成数据库关系模式设计；

（数据库逻辑结构设计是指从数据库概念模型出发，设计表示为逻辑模式的数据库逻辑结构，数据库逻辑设计的主要步骤包括：ER图转换为初始关系模式、对初始关系模式进行优化等）

物理设计：将关系模式转换为具体DBMS平台支持的关系表；数据库物理设计的目的是将数据的逻辑模式转换为实现技术规范，其目标是设计数据存储方案，以便提供足够好的性能并确保数据库数据的完整性、安全性和可恢复性，通常并不包括文件和数据库的具体实现细节。

（数据库物理设计包括：数据库逻辑模式调整；文件组织与存取设计；数据分布设计；安全模式设计；确定系统配置；物理模式评估）

每个步骤的设计活动按照数据组织与存储、数据访问与处理、应用设计等几个方面进行。

3.数据库应用系统的需求包括：

数据需求分析：主要工作是从用户师徒出发，分析与辨识应用领域所管理的各类数据项和数据结构，形成数据字典的主要内容。

业务需求分析及其在性能、存储、安全、备份和恢复等方面的要求：

在需求分析阶段，系统需求分析员与用户充分沟通，并形成文档化的需求描述；

通过需求分析过程，需要系统的描述整个应用系统的功能特征、性能特征和约束，并形成需求规范说明文档；

数据操作响应时间、系统吞吐量和最大并发用户数都是性能需求分析的重要指标。

4.ORDER BY 语句用于对结果集进行排序：

①ORDER BY 语句用于根据指定的列对结果集进行排序；

②ORDER BY 语句默认按照升序对记录进行排序；

③ORDER BY 可以对多个列进行排序，此时的排序是嵌套的；

④ORDER BY 语句只能作为其他子句之后的最后一个子句出现；

⑤视图中也可以使用ORDER BY 语句；

⑥子查询语句中是不能使用ORDER BY 子句的。

5.关于优化查询，在保证数据库一致性的前提下，将频繁操作的多个可以分割的处理过程放在多个存储过程中，这样可以大大提高系统的响应速度。

使用游标会占用较多的系统资源，尤其对于大规模并发量的情况下，很容易使得系统资源耗尽而崩溃，而使用临时表能够加速查询，相关子查询的不可加速查询。

6.在UML类图中，常见的有以下几种关系：

①泛化（箭头及指向）：带三角箭头的实线，箭头指向父类；泛化关系也称为概括关系；

②实现(箭头及指向)：带三角箭头的虚线，箭头指向接口；

③关联（箭头及指向）带普通箭头的实心线，指向被拥有者；

④聚合（箭头及指向）：带空心菱形的实心线，菱形指向整体；

⑤组合（箭头及指向）：带实心菱形的实线，菱形指向整体；

⑥依赖（箭头及指向）：带箭头的虚线，指向被使用者；

组合是部分与整体共存，如果整体不存在，部分也会消失。

聚合关系是整体与部分的关系，且部分可以离开整体而单独存在。

7.在SQL Server 2008中，常常会发生数据库数据过多的情况，此时则需要对表进行处理，通常可采用人工分割表的方法优化性能。

水平分割后，得到的子表结构相同，查询数据需要使用UNION操作；

垂直分割后，所有表中均需保留原有表的主码，查询数据需要使用JOIN操作；

当查询表中所有数据时，使用分割表方法会增加查询表达式的复杂度；

8.结构图指以模块的调用关系为线索，用自上而下的连接表示调用关系并注明参数传递的方向和内容，从宏观上反映模块层次结构的图形。

结构图包括：用例图、类图、组件图、对象图、部署图。

9.常见的数据挖掘任务包括：分类、估计、预测、相关性分组或关联规则、聚类和描述、可视化以及复杂数据类型挖掘（Text、Web、图形图像、视频和音频等）等。

10.关系表在逻辑上由一系列元祖组成，元祖由多个属性组成。

每个元祖可以用数据库磁盘文件中的一个逻辑记录来存储，记录包括多个域。

元祖的每个属性对应于文件记录中的一个域。

11.在C/S结构中，应用业务规则主要是在客户端实现的，客户端属于“胖客户端”，客户端需要专门开发；

在B/S结构中，应用业务规则主要是在WEB服务器端实现的，客户端属于“瘦客户端”，客户端一般只需要安装浏览器；

12.RecordSet 对象用于操作来自提供者的数据，使用ADO时，通过RecordSet对象几乎可对所有数据进行操作，所有RecordSet对象均使用记录（行）和字段（列）进行构造。RecordSet的常用方法为：

Addnew 创建一条新纪录；

Cancle 撤销一次执行；

Close 关闭一个RecordSet；

Delete 删除一条记录或一组记录；

MoveNext 把记录指针移动到下一条记录；

13.在SQL Server 2008中，只有创建某个临时表的连接中才能查询到当前临时表的数据，并当U1创建的该表的连接还未断开时，才能访问这个表的数据。

14.当经常进行范围查询时，在范围列上建立索引可以提高该类查询的效率。

根据索引的实线方式，索引技术被分为：有序索引和散列索引。

索引适合使用的条件：

①在经常要搜索的列上，可以加快搜索的速度；

②在经常使用连接的列上（这些列主要是一些外键）可以加快连接的速度，在经常需要根据范围进行搜索的列上创建索引，因为索引已经排序，其指定的范围是连续的；

③在经常使用WHERE子句中的列上面创建索引，加快条件的判断速度；

④经常使用order by、Group by 子句中出现的列；

⑤主键上创建索引；

⑥经常需要排序的列上；

不适合使用的条件：

①对于那些在查询中很少使用或者参考的列不应该创建索引；

②对于那些只有很少数据值的列也不应该创建索引；

③经常进行更新的列不适宜创建索引。

④经常使用LIKE操作符且字符串前后均带有%的列；

稀疏索引：只是一部分查找码的值有对应的索引记录；

稠密索引：数据文件中的每一个查找码值在索引文件中都对应一个索引记录；

聚集索引：对于数据文件和它的一个特定的索引文件，如果数据文件中的数据记录的排列顺序与索引文件中索引项的排列顺序相一致，或者说，索引文件按照其查找码指定的顺序与数据文件中数据记录的排列顺序相一致，则该索引文件称为聚集索引，否则为非聚集索引。聚集索引的键值可以重复。

15.SQL语句优化：

利用存储过程封装频繁使用的SQL语句；

不要随意使用游标；

合理使用相关子查询：

对数据库逻辑和物理结构的调整：

重新安排数据存储，整理回收碎块；

调整表结构定义；

16.DBAS生命周期模型中时间最长的阶段是运行管理与维护。其时间一般是以年为单位，其成本消耗也是巨大的。

17.两端锁协议是指所欲事务必须分为两个阶段对数据项加锁和解锁：

①在对任何数据进行读、写操作之前，要申请并获得对该数据的封锁；

②在释放一个封锁之后，事务不再申请和获得其它任何封锁；

每个事务的执行程序划分为两个阶段，加锁阶段和解锁阶段；

加锁阶段事务可以申请获得任何数据项上的任何类型的锁，但不允许释放任何锁；

在解锁阶段，事务可以释放在任何数据项上任何类型的锁，但是不能再申请任何锁；

每个事务开始执行后就进入了加锁阶段；

18.数据挖掘采用适当的算法，从数据仓库的海量数据中提取具有潜在价值的信息和知识；

19.分布式数据库系统按不同层次提供的分布透明性有：

分布透明性：位于全局概念模式与分片模式之间，最高层次

位置透明性：

局部数据模型透明性：

19.关于操作型和DSS型数据特征：

操作型数据更新频率高，DSS型数据一般不更新；

操作型数据是详细的，DSS型数据是综合的；

操作型数据处理需求事先可知，DSS型数据处理需求事先不明确；

20.数据仓库特点：面向主题、集成、稳定的、反映历史变化

21.在分布式数据库中，查询处理和优化比集中式数据库要复杂的多，其中查询优化需要考虑的主要因素包括I/O代价、CPU代价和通信代价。一般而言，分布式数据库查询优化的首要目标是使查询执行时通信代价最省。

分布式数据库采用数据分片对数据进行管理，分片有以下三个原则：

①完整性原则，即全局关系的所有数据项必须包含在某个片段中，否则将导致数据库不完整，造成某些片段数据丢失：

②重构性原则：所有片段必须能够还原全局关系：

③不相交原则（对垂直分片的主键除外），对于一个全局关系，要保证数据不丢失，则必须要属于某个片段，即不允许不属于任何一个片段，也不允许一个全局关系的某些数据既属于该全局关系的某些片段又属于该全局关系的另一个片段（垂直关系中的码属性除外）。

22.事务的四大特性：原子性、一致性、隔离性、持久性。

调度分为串行调度和并发调度；

串行调度的特点是一个事务的所有操作都执行完后才开始执行另一事务，不存在实务操作的交叉执行；

不同事务操作的交叉执行称为并发调度，DBMS交叉执行来自多个事务的各个操作，以提高数据库系统的性能。

并发调度中不同的事务的操作可以交叉执行。

23.事务日志用于保存对数据的更新操作。

事务日志是一个与数据库文件分开的文件。它存储对数据库进行的所有更改，并记录全部插入、更新、删除、提交、回退和数据库模式变化等操作。

事务日志是数据备份和数据恢复的重要文件，也是使用SQL Remote 或（复制代理）复制数据所必需的。

24.对数据库系统的监控分为手动监控机制和自动监控机制两种。

手动监控机制：数据库管理员要随时观察数据库的动态变化，并在数据库出现错误、故障或者产生不适应的情况时能随时采取有效措施保护数据库。

25.在数据库应用系统设计中，如果在事务中存在和用户的长时间交互，会降低系统的并发度，增加死锁的数量，影响检查点的效果。

26.在SQL中，用DISTINCT关键词消除重复出现的元祖。

27.数据库的一致性指的是事务执行成功则全部提交，必须使所有数据都具有一致的状态，如果一个事务提交失败，所有做过的更新全部撤销。

28.数据仓库是一个面向主题、集成的、时变的、非易失的数据集合，支持管理部门的决策过程，数据仓库通过数据转移从多个数据源提取数据，为了解决不同数据源格式上的不统一，需要进行的数据操作是转换。

29.堆文件也称为无序文件。在堆文件中，记录随机地存储在文件物理空间中，新插入的记录存储在文件的末尾。

如果数据库中的一个基本表中的数据量很少，且插入、删除、更新等操作频繁，改基本表最佳采用的文件结构是堆文件。

30.在UML模型中，用于表达一系列的对象、对象之间的联系以及对象间发送和接受消息的图是通信图/协作图。

31.数据字典是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述，其目的是对数据流程图中的各个元素做出详细的说明。

数据字典一般由数据库管理系统本身管理和维护。

日志文件记录数据库系统运行时数据库操作情况的日志信息。

数据库系统是由计算机软硬件组成的复杂系统，其体系结构与系统硬件平台密切相关。

数据库管理系统提供了查询、插入、删除、更新等通用数据操作，但没有提供各种面向具体应用领域的业务处理。

数据库中的数据是按照一定的数据模型组织和存储的、可供多个用户共享的、具有最小冗余度的相关数据集合。

32.DBAS性能指标：

①数据操作响应时间，数据访问响应时间；

②系统吞吐量，即指系统在单位时间内可以完成的数据库事务或查询的数量；

③允许并发访问最大用户数；

④每TPS（Price per TPS）代价值。

33.信息系统需求分析的常用建模方法：

①DFD：自顶向下逐步细化的结构化分析方法

②IDEFO：

③UML：

34.数据库的三级模式：

外模式（用户模式/子模式）：用户可见，可以有多个，局部模式，数据库用户（应用程序员和最终用户）能看见和使用的局部数据的逻辑结构和特征描述，是数据库用户的数据视图，是与某一应用有关的数据逻辑表示，视图是其实现方式之一；

模式（逻辑模式）：主体数据的逻辑结构，用户不可见

内模式（存储模式/物理模式）：物理结构和存储方式，只有一个，处于最底层，

外模式和模式：保证数据与程序的逻辑独立性；

内模式和模式：保证物理独特性；

35.如果希望用户u1在DB1数据库中具有查询T1表的权限，授权语句为：

GRANT SELECT ON DB1(T1) TO u1

36.在标识实体集的基础上分类抽象，将具有相同属性特征的同类对象抽象为实体集，然后归纳整理，用一个有意义的名词式短语为每一个实体（不是实体集中的每一个实例）命名。

37.数据独立性不仅简化数据库应用程序的开发，同时因为屏蔽了物理结构的差异，也简化了用户维护数据的代价；

数据库系统三级模式和两层映像的系统结构保证了数据库系统中能够具有较高的逻辑独立性和物理独立性。

38.硬件容错最完全的方法是设计两套相同的数据库系统同时工作，数据的变化也同步，空间有一定的距离，因此同时破坏两套的概率几乎为零，这样能达到数据库的完全安全。

系统故障指数据库在运行过程中，系统突然停止运转，所有正在运行的事务以非正常的方式终止，需要重新启动。

在数据库系统中，事务日志能够实现数据恢复（不是数据转储）。

39.触发器使用场合为完成比CHECK约束更复杂的数据约束，为保证数据库性能而维护的非规范化数据，实现复杂的业务规则，CHECK只能实现同一个表的列之间的取值约束。

40.数据库应用系统总体设计的主要内容包括：确定DBAS体系结构、软硬件选型和配置设计、应用软件总体设计和业务规则初步设计。

41.行为视图包括顺序图、交互图、状态图，描述系统的活动；

部署视图描述物理部署情况；

42.数据库备份分为：完整备份和差异备份

完整备份：将数据库的全部内容均备份下来；

差异备份：备份自上一次完全备份之后有变化的数据文件、日志文件以及数据库中其他被修改的内容等。

日志备份:备份自前一次备份之后的日志内容，日志备份仅仅备份日志，不备份数据；日志备份的执行效率通常比差异备份和完整性备份高，日志备份的时间间隔通常比差异备份短。

43.联机事务处理OLTP:面向交易的处理系统，基本特征是顾客的原始数据可以立即传送到计算机中心进行处理，并在很短的时间内给出处理结果，可以即时的处理输入的数据，及时回答，系统要求必须具有很高的响应速度，企业中下层使用。

联机分析处理OLAP:是数据仓库系统的主要应用，支持复杂的分析操作，侧重决策支持，并且提供直观易懂的查询结果。实时性要求不是很高、数据量大、决策支持，查询动态，随时提出查询的要求。由企业中上层使用，安全性比OLAP低。典型的应用就是复杂的动态的报表系统。

44.数据粒度划分标准可以将数据仓库中的数据划分为详细数据、轻度总结、高度总结三级或更多级。

细化程度越高，粒度越小；细化程度越低，粒度越大，综合程度越高。

如果数据仓库不保存低粒度的数据而只有粗粒度的数据，则需要存储的数据量就较少。

45.时间序列分析也可以称为数据演变分析，描述行为对象随时间变化的规律或趋势，并进行建模的数据挖掘方法。

46.分布式数据库总的数据分布策略可以从数据分片和数据分配两个角度来考虑，一般先数据分片，再数据分配。

分片是对关系的操作，而分配是对分片结果的操作；

分片模式是描述每个数据片段以及全局关系到片段的映像，分配模式是描述各片段到物理存放场地的映像。

47.SQL Server中约束类型：主键(PRIMARY KEY)约束、外键(FOREIGN KEY)约束、唯一(UNIQUE)约束、缺省(DEFAULT)约束、检查（CHECK）约束。

48.触发器三种类型：INSERT类型,UPDATE类型,DELETE类型

触发器组成：

①触发器的声明，指定触发器定时，事件，表名和类型；

②触发器的执行，PL/SQL块或对过程的调用；

③触发器的限制条件，通过where子句实现；

49.GRANT:允许一个数据库用户或角色执行所授权限指定的操作；

DENY:拒绝一个数据库用户或角色的特定权限，并且阻止它们从其他角色中继承这个权限；

REVOKE:收回已经授予的权限。

50.在动态转储中，利用转出文件只能将数据库恢复到转储过程的某个状态，且转储文件中的数据可能不一致，只有和日志文件综合起来使用，才能使数据库恢复到一致状态。

51.OLAP的实现方式：MOLAP,ROLAP,HOLAP

52.数据库应用系统逻辑设计阶段工作内容：数据库逻辑结构设计、数据库事务概要设计、应用程序概要设计。

数据库概念设计：系统总体框架设计

数据库概念设计的目标：

定义和描述应用领域涉及的数据范围；

获取应用领域或问题域的信息模型；

描述清楚数据的属性特征；

描述清楚数据之间的关系；

定义和描述数据约束；

说明数据的安全性要求；

支持用户的各种数据处理要求；

保证信息模型方便地转换成数据的逻辑结构（数据库模式），同时也便于用户理解。

53.不同数据库管理系统有着不同的逻辑实现结构，数据库空间管理办法随数据库管理系统不同而不同；

数据库管理员需要通过历史数据分析并根据应用系统情况，对数据库所使用的空间情况进行预测；

应重点监控空间增长比较快的表，当数据量超过存储能力前及时增加存储空间；

当硬件存储空间无法满足数据库需求时，可以考虑部分不使用的历史数据转移到其他廉价存储中。

54.SQL的集合操作符：

IN:确定给定的值是否与子查询或列表中的值相匹配，选择与列表中的任意一个值匹配的行；

EXCEPET:指在第一个集合中存在，但是不存在于第二个集合中的数据；

INSERSECT:指在两个集合中都存在的数据；

UNION:操作符用于合并两个或多个SELECT语句的结果集，UNION内部的SELECT语句必须拥有相同数量的列，列也必须拥有相似的数据类型，每条SELECT语句中的列的顺序必须相同。

55.从功能上讲，数据库应用系统设计包括：

表示层：位于最外层，离用户最近，用于显示数据和接受用户输入的数据；一般为Windows或Web应用程序。

业务逻辑层：表示层和数据访问层之间通信的桥梁，主要负责数据的传递和处理，例如数据有效性的检验、业务逻辑描述相关功能。

（业务逻辑层概要设计包括:结构、行为、数据接口、故障处理、安全设计、系统维护与保障等方面的内容）

数据访问层：主要实现对数据的保存和读取操作；可以访问关系数据库、文本文件或XML文档等。

数据持久层：以程序为媒介把表现层或服务层的数据持久化，它位于物理层和数据访问层之间。

56.分布式数据达到的目标：本地自治、非集中式管理、高可用性、位置独立性、数据分片独立性、数据复制独立性、分布式查询处理、分布式事务管理、硬件独立性、操作系统独立性、网络独立性、数据库管理系统独立性；

并行数据库的目标：高性能和高可用性，通过多个处理节点并执行数据库任务，提高整个数据库系统的性能和可用性。

57.数据库系统实施活动包括：创建数据库、装载数据、应用程序的编码和调试以及数据库的试运行。

58.数据分配方式：

集中式：所有数据片段都安排在同一个场地上；

分割式：所有数据只有一份，它被分割成若干逻辑片段，每个逻辑片段被指派在一个特定的场地上；

全复制式：数据在每个场地重复存储，也就是每个场地上都有一个完整的数据副本；

混合式：全局数据被分为若干个数据子集，每个子集都被安排在一个或多个不同的场地上，但是每个场地未必保存所有数据，这是一种介乎于分割式和全复制式之间的分配方式。

59.ODS(Operational Data Store)是数据仓库体系结构中的一个可选部分，它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。

第一类ODS数据更新频率是秒级；

第二类ODS数据更新频率是小时级；

第三类ODS数据更新频率是天级；

第四类ODS是根据数据来源方向和类型划分的，不仅包含来自操作型环境的数据，也包含由数据仓库层和数据集市层的应用反馈给ODS的一些决策结果或一些报表信息。

60.用于数据库完整性保护：创建触发器、定义事务隔离性级别；

数字签名用于数据防篡改；

定义主码用于实体的完整性；

61.协作图：用于描述对象在空间中如何交互，即除了动态交互，它也直接描述了对象如何链接在一起的情形；

状态图：用于描述一个对象在其声粗空间的动态行为，表现为一个对象所经历的状态序列，引起状态转移的事件，以及因状态转移而伴随的动作。一般可以用状态机对一个对象的生命周期建模，状态图用于显示状态机，重点在于描述状态图的控制流。

顺序图：用于描述指定的一组对象是如何交互的，它着眼于消息队列，也就是在消息间如何发送和接收信息。

部署图：描述的是系统运行时的结构，展示了硬件的配置及其软件如何部署到网络结构中。一个系统结构只有一个部署图，通常用来帮助理解分布式系统。

62.数据库管理员的职责：

数据库的转储和恢复；

数据库的安全性、完整性控制；

数据库性能的检测和改善；

数据库的重组和重构；

63.触发器通常用于保证业务规则和数据完整性，主要优点是用户可以用编程的方法来实现复杂的处理逻辑和业务规则，增强了数据完整性约束的功能。

64.数据库镜像优点：

①增强数据保护功能。数据库镜像提供完整或接近完整的数据冗余，具体取决于运行模式是高安全性模式还是高性能模式；

②提高数据库的可用性。发生灾难时，在具有自动故障转移功能的高安全性模式下，自动故障转移可快速使数据库的备用副本在线（而不会丢失数据）。在其他运行模式下，数据库管理员可以选择强制服务（可能丢失数据），以替代数据库的备用副本；

③提高生产数据库在升级期间的可用性。

65.在内联表值函数中，没有相关联的返回变量；

内联表值函数通过SELECT语句填充函数返回的表值；

内联表值函数的作用类似于带参数的视图；

调用内联表值函数时，只能将内联表值函数放在FROM子句中。

66.公共云指的是云以即用即付的方式提供给公众；

私有云是指不对公众开放的企业或组织内部数据中心的资源。

67.UML(建模语言）的语句是定义在一个四层建模概念框架中的，这四层分别是：元元模型层、元模型层、模型层和用户模型层。

68.在UML中，聚集是一种特殊形式的关联，它表示类至今是整体与部分的关系。

69.在衡量数据库应用系统的性能指标中，数据吞吐量指的是系统在单位时间内可以完成的数据库事务数量。

70.加锁协议中两阶段加锁协议可以保证事务调度可串行性。

71.并行数据库中一维数据的划分方法：

轮转法：最适合于扫描整个关系；

散列划分法：比轮转法更适合点查询，也适合顺序扫描关系；

范围划分法：明显利于范围查询和点查询。

72.在SQL Server 2008中，对于更新操作的触发器，系统将产生两张逻辑工作表，DELETED表用于存储更新前的数据，INSERTED用于更新后的数据。

73.Google的云数据库是一个分布式的结构化数据存储系统，称作Bigtable.

74.知识发现由三个阶段组成：数据准备、数据挖掘、结果的解释评估。

75.分布式数据库系统按不同层次提供的分布透明性有：

分片透明性：

位置透明性：指数据分片的分配位置对用户是透明的，用户编写程序时只需要考虑数据分片情况，不需要了解各分片在各个场地的分配情况。

局部映像透明性：

76.日志文件是用来记录事务对数据库的更新操作的文件，日志文件主要有两种格式：以记录为单位的日志文件和数据块为单位的日志文件。

77.数据库完整性包括：

实体完整性：在CREATE TSBLE 中用PRIMARY KEY 定义；

参照完整性：在CREATE TSBLE 中用FOREIGN KEY 短语定义哪些列为外码，用REFERENCES短语指明这些外码参照哪些表的主码；

用户自定义完整性：在CREATE TSBLE 中定义属性的同时也可以根据应用要求，定义属性上的约束条件，即属性值限制，包括：列值非空NOT NULL ,列值唯一 UNIQUE,检查列值是否满足一个布尔表达式CHECK 短语。

78.需求分析

数据需求分析：

数据处理需求分析：从对数据组织与存储的设计角度，辨识应用领域所管理的各类数据项和数据结构，与数据处理需求分析结果一起，组成数据字典，形成“数据规范说明书”；

功能需求分析（数据处理需求分析与业务规则需求分析）：主要针对DBAS应具有的功能进行分析，是DBAS需求分析的核心环节，总体上可分为数据处理需求分析与业务规则需求分析。

性能需求分析：描述系统应当做到什么程度，分析DBAS应具有的性能指标；

其它需求分析：存储需求、安全性需求等。

存储需求分析指估计DBAS系统需要的数据存数量，如DB所存储的数据总量；

安全性需求分析用于数据库安全设计，避免被非法使用和攻击。

79.安全性保护：用户身份鉴别、权限控制、视图机制；

双机热备属于数据库恢复技术内容；

80.

①散列文件：利用散列存储方式组织的文件，也称为直接存取文件。

优点：文件随机存放，记录不需进行排序；插入、删除方便；存取速度快；不需要索引区，节省存储空间。

缺点：不能进行顺序存取，只能按关键字随机存取，且询问方式只限于简单询问，并且在经过多次插入、删除后，也可能造成文件结构不合理，需要重新组织文件。

②堆文件

如果数据库中的一个基本表的数据量很少，并且插入、删除、更新等操作非常频繁，该基本表可以采用堆文件组织形式。

因为堆文件无需建立索引，维护代价非常低。

虽然堆文件的数据访问效率较低，但在数据量很少时，定位文件记录的时间非常短。

③顺序文件

指的是文件信息存放在若干连续的物理块中。

优点：简单，支持顺序存取和随机存取，顺序存取速度相对较快。

缺点：文件不能动态增长，不利于文件插入和删除。

如果用户的查询条件定义在查找码上，则顺序文件是比较合适的文件结构。

④聚集文件

将不同关系表中有关联关系的记录存储在一起。

如果某些重要而频繁的用户查询经常需要进行多表连接操作，可以考虑聚集文件，来改善查询效率。

81.预防死锁：

①各个事务应顺序访问共享资源，将复杂的、大的事务分解成多个简单、小的事务；

②按同一顺序访问对象；

③事务隔离性级别；

④使用绑定连接；

⑤灵活使用显示加锁技术等。

82.关系模式描述关系的静态结构，它是静态的、稳定的，而关系是动态、随用户对数据库的操作而变化的。

83.数据库系统设计分为：需求分析、概念结构设计、逻辑结构设计和物理结构设计等。

84.一个属性的值必须属于唯一的域，属性的取值必须为同一域。标识属性的值不能重复且不可以为空。

85.人机界面的设计可采用原型迭代法，首先进行初步设计，再进行用户界面细节设计，最后是原型设计与改进。

86.数据库应用系统物理设计阶段的主要活动有：

确定存储结构、存取路径的选择和调整、确定数据存放位置和确定存储分配。

87.ER图向关系模式转换涉及到两个方面：①实体的转换；②实体间联系的转换。

实体的转换：在从ER图转换为关系模式时，一个实体就转换成一个关系模式，实体的属性就是关系模式的属性，实体的键就是关系的主键。

实体间联系的转换：实体间存在三种联系，即1:1（一对一），1：m（一对多），m:n（多对多）。

88.DFD的主要组成包括

外部实体（外部项）：指系统之外又和系统有联系的人或者事务，说明了数据的外部来源和去处；

处理过程：指对数据逻辑处理，也就是数据变换，用来改变数据值；

数据存储和数据流：指处理功能的输入输出数据存储表示数据保存的地方，用来存储数据。

89.数据库实施阶段包括：建立数据库结构、数据加载、事务和应用程序的编码及测试、系统集成、测试与试运行、系统部署。

90.主文件组是系统定义好的一个文件组，它包含主要数据文件和任何没有明确分配给其它文件组的其它数据文件。如果次要数据文件没有分配给其它文件组，也是可以放在主文件组中的。

91.分离数据库时需要停用被分离的数据库，但是不需要停用SQL Server 服务。

92.是否创建分区表主要取决于表当前的数据量大小以及将来的数据量大小，同时还取决于对表中的数据如何进行操作。

93.Windows用户只有系统管理员组成员才有权限登录到SQL Server.

94.

95.数据库运行时维护包括：日常维护，监控与分析，性能优化与调整，系统进化。

96.数据库的重组并不修改原设计的逻辑和物理结构，而数据库的重构则要部分的修改数据库的模式和内模式。

97.如果业务空闲时数据库服务器的CPU使用率达到90%，说明服务器的cpu资源已经严重不足，如果工作高峰时CPU使用率仍然很低，则说明服务器CPU资源充足。

98.事务故障包括预期内的事无故障和非预期的事务故障，两种事务故障的恢复都是由系统自动完成的，对用户是透明的。

99.SQL Sever2008支持三种恢复模式：简单恢复模式、完整恢复模式、大容量日志恢复模式。

简单恢复模式只用于测试和开发数据库，或用于主要包含只读数据的数据库（如数据仓库）。

100.①共享内存的优势是实现简单，缺点是由于共享内存，如果处理器数量过多，容易造成访问内存冲突。

②共享磁盘结构所有的处理机拥有独立的主储存器，通过互联网共享磁盘。这种结构可以克服共享内存结构，但是由于是通过互联网实现处理器之间的信息交换，会产生一定的通信代价。

③无共享结构每个处理机拥有独立的主存储器和磁盘，不共享任何资源。它被认为是支持并行数据库系统的最好并行结构，比较适用于银行、出纳、民航售票等OLEP类应用。

④分布式数据库系统的主要目的是实现场地自治和数据全局透明共享。

101.分片透明性是最高级别的透明性，位于全局概念模式与分片模式之间。

102.在T-SQL中，能够实现分情况显示不同类型数据的函数是CASE.

103.

104.通过在视图上创建唯一聚集索引的方式可使视图的结果集保存到数据库中。

105.

106.增加派生性冗余列的调优方法是典型的以空间换时间的调优方法。

107.SQL Sever 2008数据库中，索引视图是存储一个查询结果的数据库对象。

对视图创建唯一聚集索引后，视图的结果集将存储在数据库中，建有唯一聚集索引的视图称为索引视图，也称物化视图。

108.非预期的事务内故障包括：运算溢出故障、并发事务死锁故障、违反了某些完整性限制而导致的故障。

109.在分布式数据库中，垂直分片从列的角度将关系分为不同的片段。

110.在并行数据库中，无共享结构被认为是支持并行数据库系统的最好并行结构，适用于银行出纳之类的应用。

111.

112.

113.系统规划和定义的具体内容包括：任务陈述、确定任务目标、确定系统范围和边界、确定用户视图。

114.DFD中的箭头表示的数据的流向，不能表示控制流和约束。

115.

116.稀疏索引所指向的数据文件一定是有序的。

117.元元模型层组成了UML的最基本的元素“事物”，代表要定义的所有事物。

118.标量函数的返回值可以是除了timestamp类型以外的所有数据类型。

119.一个数据库的日志文件的大小和数据文件的大小之间没有联系。

120.视图返回的结果集的格式与基本表相同，所以可以在视图上再定义视图。

121.

122.

123.数据库运行维护包括数据库的转储和恢复、数据库的安全性和完整性控制，数据库性能的监控分析和改进，数据库的重组和重构。

124.索引一般会提高查询的效率，而不会提高插入、删除和更新操作的执行效率。

在组合索引中，索引属性的顺序一般按照属性的区分度进行排列。

125.

126.分布式数据库最基本的特征是本地自治、非集中式管理、高可用性。

127.一般分布式数据库查询优化的首要目标是通信代价。

128.轮转法对于点查询和范围查询的处理较复杂，由于不知道所要查找的元组具体分布在哪个磁盘上，必须对所有磁盘进行查找，明显降低了查询效率，不适合点查询。散列划分和范围划分方法均利于点查询。

129.决策支持系统一般是指企业中以数据为基础对重要业务或事务实施辅助决策的信息系统。

130.K-means算法模型无法直接用于分类。

131.数据库性能优化中，存储优化包括建立物化视图和聚集。

132.数据库应用系统的性能需求分析包括数据操作响应的时间或数据访问响应时间，系统吞吐量、允许并发访问的最大用户数、每TPS代价值。

133.在DFD中，数据流用箭头表示，处理用矩形框表示，数据存储用圆角矩形框表示，外部项用圆角框或者平行四边形框表示。

134.从功能角度可以将数据库应用系统划分为4个层次：

表示层：进行人机界面设计

业务逻辑层：梳理DBAS的各项业务活动，将其表示为各种系统架构

数据访问层：针对DBAS的数据处理需求设计用于操作数据库的各类事务

数据持久层：进行应用系统的存储结构设计。

135.不能再视图上定义AFTER型触发器。

136.

137.数据库应用系统的环境安全设计包括漏洞与补丁、计算机病毒防护，网络环境安全和物理环境安全。

138.关于强制存取控制：

仅当主体的许可证级别不低于客体的密级时，该主体才能读取相应的客体；

仅当主体的许可证级别不高于客体的密级时，该主体才能写相应的客体。

139.分布式数据库系统是物理上分散、逻辑上集中的数据库系统。

140.范围划分：范围查询、点查询

轮准法：扫描整个关系的应用，充分发挥并行性；

散列划分：适合点查询

141.将oltp系统中数据利用抽取程序抽取出来的主要原因是解决OLTP应用于分析型应用之间的性能冲突问题。

142.在UML提供的图中，活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序，并行次序。

143.分布式数据库最基本的三个特征：非集中式管理、高可用性、本地自治

144.

概念模型的典型代表

完成数据库关系模式设计的阶段

存储过程的优点

利用哈希函数快速访问的文件是

数据库镜像的优点

SQL Sever用户来源创建用户角色是语句是

ODBC接口是

VB6.0数据绑定控件必须

ADO数据控件用于连接数据源的属性是

Record set 对象的ADDNEW方法的功能是

不是建立数据仓库的合理理由

从OLTP中抽取数据，建立新的数据分析环境的最初出发点是

用二维表结构在计算机中存储数据及数据之间联系的数据模型被称为

为避免活锁现象，数据库管理系统采用策略处理事物的加锁请求

搜索引擎在用户输入一个关键词后，会向用户推荐最近一段时间其他关键词，达到挖掘算法

创建唯一的聚集索引

数据库镜像分为三种模式

145.

146.

147.

148.安全性保护：

用户身份鉴别、权限控制、视图机制

双机热备属于数据库恢复技术内容

149.UML:

类图是展现一组类、接口和协作以及它们之间的关系的一种静态视图

协作图是交互图的一种，其中包含一组对象、对象之前的联系以及对象间发送和接收的信息

状态图主要用来描述一个实体在发生事件时的状态变化情况，用于展示该实体处于不同状态时对不同事件做出响应后的状态变化情况

顺序图是用来描述对象自身及对象间信息传递顺序的视图

活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序、并行次序。

150.COUNT()函数用于统计元祖的个数或者某个字段中值的个数

SUM（）则用来计算某个字段值得总和

151.前触发型触发器是在引发该触发器执行的操作语句执行之前激活的触发器，而后触发器就是在语句执行之后激活的触发器。

152.每个数据库有且仅有一个主要的数据文件，可以有多个次要数据文件，每个数据库必须至少有一个日志文件，也可以有多个日志文件

153.分离数据库时不仅分离数据文件，还要一起分离日志文件。

154.分区表的本质是把符合不同标准的数据子集存储在某个数据库的一个或多个文件组中，通过元数据来表述数据存储的逻辑地址。

155.数据库的重组并不修改原设计的逻辑和物理结构，而数据库的重构则要部分的修改数据库的模式和内模式。

156.检查点应当由数据库恢复子系统自动的定期或者不定期的建立，而不应当由数据库管理员手动建立。

157.

158.分布式数据库中，传输的代价是：I/O代价+CPU代价+通信代价。

分布式数据库中查询优化的首要目标是：使查询执行时通信代价最省。

159.

160.混合式数据分配是一种介于分割式和全复制式的分布方式。

161.局部数据模型透明性指用户或应用程序要了解分片及片段存储的场地，但不必了解场地上使用的是何种数据模型。

162.

163.DFD即数据流图，它是由数据流、（对数据的加工）处理、数据存储和外部项组成。

164.

165.在进行数据库模式调整使用分割表进行数据库优化时，一般有两种表分割方式：水平分割和垂直分割。

166.新增汇总表的调优方法是一种以空间换时间的调优方法。

167.

168.

169.数据挖掘方法中，关联规则挖掘就是用于发现数据库中数据间的关联性的。

170.系统规划与定义的内容包括：任务陈述、确定系统范围和边界、确定用户视图。

171.数据库应用系统实现与部署内容包括：①建立数据库结构；②数据加载；③事务和应用程序的编码及测试；④系统集成、测试与试运行；⑤系统部署。

172.数据库逻辑设计的目标是得到实际的数据库管理系统可处理的数据库模式，各模式结构合理，数据之间不存在不合理的数据依赖关系，且满足各类应用的处理和使用要求，为数据库的物理设计及数据库高效、正确地运行打下基础。

173.事务概要设计内容包括：事务名称、事务所访问的关系表及关系属性、事务处理逻辑、事务用户（指使用、启动、调用该事务的软件模块或系统）

174.降低事务隔离级别可以提高事务的吞吐量，提高活锁的可能性，降低发生死锁、发生阻塞的可能性。

175.存储过程可以接受多个输入参数，也可以接受多个输出参数。

176.唯一索引的作用是保证索引键值的不重复。

177.Oracle 的安全控制可分为数据库级、表级、行级和列级

178.很多情况下，数据库性能优化需要研发人员和DBA共同配合完成。

179.数据库设计过程中，数据库的一致性设计往往以牺牲效率为代价

180.事务日志备份并不备份数据库本身，它只备份日志记录，而且只备份从上次备份之后到当前备份发生变化的日志内容。

181.分布式数据库最基本特征是本地自治、非集中式管理以及高可用性。

182.在并行数据库中的数据划分与并行算法中，范围划分会引起数据分布不均匀，导致并行处理能力下降。

183.

184.

185.

186.

187.

188.

189.

190.

数据库自学日记
1.建立数据仓库不是简单的把企业的各种应用集中在一起，而是利用企业系统生成的数据，以面向主题、集成的方式合理组织数...
Linux常用命令，实战问题合集～
曾经老徐分享过几篇Linux相关的文章：Linux是什么？概念普及自学之路 | 数据库、Linux需要自学到什么程...
MySQL 自学笔记
我要自学网 MySQL数据库教程自学笔记随手所记，因为视频课程时间略长，记录共享出来供大家互相学习及自己日后查...
手把手SQL快速入门
让自学更有效率不迷茫 SQL是一种专门用来与数据库通信的语言。 DB：Database，数据库。SQL：Struc...
自学日记
4/19/2019 今天继续学习402： 1.barrier problem generation 的处理方法 2...
SQL Server基本命令与用法总结
最近正在自学数据库原理与编程，觉得SQL Server上手非常舒适，于是写了这篇简书，希望对学习数据库的朋友们有所...
从序列到表达矩阵
平台：Linux 服务器、Rstudio数据：NCBI数据库（SRR2932830） 1.下载序列参考菜鸟自学...
2018-09-12yummy工作安排
+数据库基本原理 +日常工作 +日记
runtime自学日记
1.runtime 是什么 runtime 就是运行时。 2.为什么要有runtime 根据OC的特性“消息发送机...
英语自学——日记
再来谈谈最近的英语学习吧，前段时间比较空闲往前赶了很多课程，这几天又开始忙碌起来，一开始是网费到期，所以光续一年合...