一. 什么是数据库?
1. 数据库和 DBMS
数据库 是保存有组织数据的一种容器,我们可以把数据库想象成办公室的文件柜,文件柜是一个存放数据的物理位置。
我们使用 DBMS 数据库管理系统访问数据库,即通过 DBMS 创建和操纵数据库这个容器。
常见的 DBMS 包括 MySQL、Oracle、SQL Server 等。
数据库:保存有组织的数据的容器。
2. 表
在将资料放入文件柜时,我们通常并不会随意扔进某个抽屉,而是在文件柜中创建文件,然后将资料放入特定的文件中。
在数据库中,表就相当于文件柜中的文件,用来存储某种特定类型的数据,如学生信息、课程信息、班主任信息等等。
表:某种特定类型数据的结构化清单。
3. 列和数据类型
表由列组成。列中存储着表中某部分信息。可以将数据库表想象为一张电子表格,表格中的每一列存储着一条特定信息。
比如上述的订单表中,订单 ID 列存储着所有订单的唯一编号,订单日期列存储着下单时间,等等。
列:表中的一个字段。表由一个或多个列组成。
数据库中每个列都有相应的数据类型,数据类型定义列可以存储的数据类型。如数值类型、日期类型、字符串类型等等,创建表时必须对数值类型给予特别的关注。
4. 行
表中的记录是按行存储的,所保存的每个记录都存储在自己的行内。比如,上述订单表中,每一行记录存储了该笔订单的相关信息。
行:表中的一个记录。
二. 主键
表中的每一行都应该有一列或几列可以唯一标识自己。比如订单表中的订单 ID 用来唯一标识一条订单记录。
主键:一列(或几列),其值能够唯一标识表中每一行。
作为主键的列需要满足以下条件:
- 任意两行都不具有相同的主键值;
- 主键列不允许存在空值 NULL;
- 主键列中的值不允许修改或更新;
- 主键值不能复用,比如某行从表中删除,它的主键不能赋给以后的新行。
满足以上条件,就可以用该列作为主键,用来标识一个特定的行。
三. 什么是 SQL?
SQL (Structured Query Language) 结构化查询语言,是一门专门用来与数据库沟通的语言,从数据库中读写数据。与其他编程语言不同,SQL 只有很少的词,用来有效地完成数据库的读写工作。
下面列出了 SQL 的优点:
- SQL 不是某个特定数据库厂商的专有语言。绝大多数常用的 DBMS 都支持 SQL,因此 SQL 的使用范围还是很广的;
- SQL 简单易学,相比其他语言(Python、Java)具有非常少的关键字;
- SQL 看似简单,但确是一种强有力的语言,可以实现非常复杂和高级的数据库操作。
注:本连载的系列文章主要是针对数据分析师而言需要掌握的 SQL,因此不涉及插入、修改、删除记录,创建表等 SQL 操作,文章内容全部都是围绕 SELECT 查询语句展开。
网友评论