连载的上一篇我们使用子查询来过滤数据、创建计算字段。但我们也发现使用子查询在性能方面的不足,尤其是在创建计算字段的时候,需要对检索出的每天数据都执行一次子查询。
本篇文章,我们将介绍一种新的方式来完成前一篇文章的检索任务,即 联结 ,SQL 最强大的功能就是在查询时联结(JOIN)表。下面,我们首先来了解一下什么是联结?以及为什么我们要使用联结吧!
什么是联结
1、关系表
关系表设计的思想简单来讲,就是把信息分解成多个表,一类数据一个表,表与表之间通过某些共同的值相互关联,这也是关系型数据库名称的来源。
小鱼以如下的两张关系表为例:第一张表为产品信息表 Products,第二张表为供应商信息表 Venders。
其中,Venders 表存储供应商信息,每个供应商占一行,具有唯一的标识,即主键 primary key ,可以是供应商 ID 或任何其他唯一值。
Products 表存储产品信息,除了供应商 ID (Venders 表的主键)外,Products 表不存储有关供应商的任何信息。而是利用 Venders 表的主键将 Venders 表与 Products 表关联,根据供应商 ID 从 Venders 表中找出某产品供应商的详细信息。
将信息分来存储,然后利用共同的值进行关联,这样做可以带来如下好处:
- 在产品表中,供应商信息不重复,节省时间和空间;
- 如果供应商信息发生改变,只需要更新 Venders 表中的一条记录即可,产品表 Products 不需要做任何更改,保证了数据的一致性。
2、为什么使用联结
将信息分开存储后,提高了存储的时间和空间效率,保证了数据的一致性。但是,如果数据存储在多张表中,那如何用一条 SELECT 语句检索出多张表组合后的信息呢?
这就需要使用联结操作啦!我们使用联结在一条 SELECT 语句中关联表,在运行 SQL 时关联表中正确的行,进而联结多张表返回一组输出。
创建 SQL 联结
1、WHERE 子句
使用 SQL 创建联结的第一种方式非常简单,只需要在 WHERE 子句中,指定要联结的表以及关联它们的方式即可。下面的 SQL 返回各供应商提供的产品以及产品价格:
SELECT
vend_name,
prod_name,
prod_price
FROM
Vendors,
Products
WHERE
Vendors.vend_id = Products.vend_id;
检索运行结果:
上述 FROM
子句中列出了两个表:Venders
和 Products
,即我们要联结的两张表。Venders
表和 Products
表通过 WHERE
子句正确地联结,WHERE
子句指示 DBMS 将 Venders
表中的 vend_id
与 Products
表中的 vend_id
匹配起来。
注:WHERE 子句中使用了完全限定列名,即使用 表名.列名 的语法来指示列。因为两张表都有
vend_id
字段,如果不指定表名,就无法确定是哪张表的vend_id
字段。
2、笛卡尔积
小鱼在刚开始学习 SQL 的时候,一直觉得用 WHERE 子句建立联结感觉奇奇怪怪的:WHERE 子句不是过滤吗?为什么又要用来指定联结的条件呢?
其实,这一点也不奇怪。在数据库表的定义中,并没有指出 DBMS 如何对表进行联结,联结的建立完全是根据 SELECT 语句创建的。
在联结两张表时,实际上会将第一张表中的每一行与第二张表中的每一行配对,就好比是计算笛卡尔积一样,检索出的函数将会是第一张表中的行数乘以第二张表中的行数。
这时候,WHERE 子句中的过滤条件就至关重要了,只包含匹配给定条件(联结条件)的行。如果忘记 WHERE 子句,结果就是笛卡尔积的形式,而不管它们逻辑上是否能匹配在一起。下面是忘记 WHERE 子句的联结查询:
SELECT
vend_name,
prod_name,
prod_price
FROM
Vendors,
Products;
部分输出截图:
上述返回的数据,用每个供应商匹配了 Products
表中的所有产品,这样的结果显然不是我们想要的。
注:WHERE 子句在联结查询时直观重要,请不要遗漏 WHERE 子句,否则 DBMS 将返回比想要的数据多得多的数据。
3、内联结
上述的联结基于两个表之间的相等测试,称为等值联结,又叫作内联结 Inner Join 。其实,如果使用 WHERE 子句的方式容易遗忘 WHERE 的话,你也可以选择另外一种更明确的语法,来明确指定联结的类型。
SELECT
vend_name,
prod_name,
prod_price
FROM
Products
INNER JOIN Vendors ON Products.vend_id = Vendors.vend_id;
运行结果:
INNER JOIN 声明内联结,表明 Products
和 Venders
都只返回满足条件 Products.vend_id = Vendors.vend_id
的联结记录,其中联结的条件使用 ON 子句给出。
4、联结多张表
SQL 不限制一条 SELECT 语句中允许联结的表的数目,创建联结的基本规则也是可以类推的:先列出所有表,然后定义表之间的关联关系。
下面,我们将关联上述三张表,检索订单 20007
中产品的详细信息及产品供应商的名称。
SELECT
prod_name,
vend_name,
prod_price,
quantity
FROM
OrderItems,
Products,
Vendors
WHERE
OrderItems.order_num = 20007
AND OrderItems.prod_id = Products.prod_id
AND Products.vend_id = Vendors.vend_id;
检索结果:
上述 SQL 中的 FROM 子句列出了关联的 3 张表,关联条件为 OrderItems.prod_id = Products.prod_id
和 Products.vend_id = Vendors.vend_id
。也就是说,联结配对结束后,只有满足订单号为 20007 且 OrderItems 表中的产品 ID 和 Products 表中的产品 ID 相等,并且 Products 表的厂商 ID 和 Venders 表的厂商 ID 也相等,记录才会被保留。
当然了,也可以使用语法更明确的 INNDER JOIN ... ON 语法:
SELECT
prod_name,
vend_name,
prod_price,
quantity
FROM
OrderItems
INNER JOIN Products ON OrderItems.prod_id = Products.prod_id
INNER JOIN Vendors ON Products.vend_id = Vendors.vend_id
WHERE
order_num = 20007;
最后,我们来回顾一下连载上一篇文章中,使用子查询检索订购了产品 RANG01 的顾客列表,设计的关系表如下:
使用内联结建立查询:
SELECT
cust_name,
cust_contact
FROM
Customers,
Orders,
OrderItems
WHERE
Customers.cust_id = Orders.cust_id
AND Orders.order_num = OrderItems.order_num
AND OrderItems.prod_id = 'RGAN01';
或者
SELECT
cust_name,
cust_contact
FROM
Customers
INNER JOIN Orders ON Customers.cust_id = Orders.cust_id
INNER JOIN OrderItems ON Orders.order_num = OrderItems.order_num
WHERE
OrderItems.prod_id = 'RGAN01';
检索运行结果:
总结
联结是 SQL 中非常重要的特性,本节我们只是学习了联结中的一种:等值联结(内联结),连载的下一篇文章中,小鱼将和大家一起学习其他类型的联结创建。
网友评论