第一章概述
文章目录
- 第一章概述
- 1. 数据库概述
- 2. 数据库相关概念
- 3. 数据库系统 DBS
- 4. 外模式/模式映像
- 5. 模式/内模式映像
- 6. 数据独立性
- 第二章关系数据库
- 1. 关系模型
- 2. 码(Key)
- 3. 关系模型三要素
- 4. 关系代数
- 第三章结构化查询语言 SQL
- 1. 视图(View)
- 2. 视图的优点
- 3. 查询视图
- 4. 视图与基本表的区别
- 5. 创建和删除视图
- 6. 数据定义
- 7. 数据查询
- 第四章关系数据库编程
- 1. 嵌入式 SQL(Embedded SQL)
- 2. 存储过程(Stored Procedure)
- 3. ODBC 编程(Open Database Connectivity)
- 4. JDBC 编程(Java Database Connectivity)
- 5. 游标(Cursor)
- 6. 存储过程
- 7. ODBC 编程
- 8. JDBC 编程
- 第五章数据库安全
- 1. 数据库安全性(Database Security)
- 2. 存取控制(Access Control)
- 3. 数据库角色(Database Roles)
- 4. 审计(Auditing)
- 5. 视图机制(View Mechanism)
- 6. 数据加密(Data Encryption)
- 7. 授权(Authorization)
- 8. 回收(Recovery)
- 第六章数据库完整性
- 1. 数据库完整性(Database Integrity)
- 2. 实体完整性(Entity Integrity)
- 3. 参照完整性(Referential Integrity)
- 4. 用户自定义完整性(User-Defined Integrity)
- 5. 触发器(Trigger)
- 6. 完整性约束的实施
- 7. 完整性约束的检查
- 8. 完整性约束的维护
- 第七章并发控制
- 1. 事务(Transaction)
- 2. 并发操作问题(Concurrency Issues)
- 3. 封锁(Locking)
- 4. 封锁粒度(Lock Granularity)
- 5. 封锁的工作原理(Locking Mechanism)
- 6. 封锁协议(Locking Protocols)
- 7. 并发控制(Concurrency Control)
- 第八章关系数据库规范化理论
- 1. 关系数据库的规范化理论(Normalization Theory)
- 2. 函数依赖(Functional Dependency)
- 3. 范式(Normal Form)
- 4. 模式分解(Schema Decomposition)
- 5. 模式分解算法(Decomposition Algorithms)
- 第九章关系数据库设计
- 第十章 NoSQL
- 第十一章 SQL 编程
- 数据库的基本操作
- 基本表的定义、修改、删除
- 索引的建立与删除
- 数据更新
- 数据查询
- 单表查询
- 连接查询
- 内连接(INNER JOIN)
- 左连接(LEFT JOIN)
- 右连接(RIGHT JOIN)
- 全连接(FULL JOIN)
- 嵌套查询
- 集合查询
- 视图
- 视图与基本表的区别
- 视图的优点
- 3.6.4 查询视图
- 3.6.5 更新视图
1. 数据库概述
- 定义:数据库是长期存储在计算机内的、有组织的、可共享的数据集合。
- 目的:为了高效地存储、管理和检索数据。
2. 数据库相关概念
- 数据管理:涉及数据的收集、存储、维护和使用的过程。
- 数据库管理系统(DBMS):软件系统,用于创建、维护和使用数据库。
3. 数据库系统 DBS
- 模式(Schema):数据库的逻辑结构,定义了数据的组织方式和数据之间的关系。
- 外模式(External Schema):用户视图,用户与数据库交互时看到的数据结构。
- 内模式(Internal Schema):数据在物理存储介质上的存储方式。
4. 外模式/模式映像
- 定义:外模式与模式之间的映射,允许用户以不同的视图访问数据库。
- 作用:提供数据的逻辑抽象,隐藏数据库的物理细节。
5. 模式/内模式映像
- 定义:模式与内模式之间的映射,定义了数据的逻辑结构如何映射到物理存储。
- 作用:确保数据的物理存储与逻辑结构之间的一致性。
6. 数据独立性
- 数据的逻辑独立性:外模式与模式之间的独立性,允许在不影响应用程序的情况下修改数据库的逻辑结构。
- 数据的物理独立性:模式与内模式之间的独立性,允许在不影响应用程序和逻辑结构的情况下修改数据的物理存储。
第二章关系数据库
1. 关系模型
- 关系数据库:基于关系模型的数据库,数据以表格的形式存储。
- 关系:数据库中的基本数据结构,由行和列组成。
- 关系模式:定义了关系的结构,包括属性和属性之间的关系。
2. 码(Key)
- 主码(Primary Key):用于唯一标识关系中每一行的属性或属性组合。
- 外码(Foreign Key):用于在两个关系之间建立联系的属性或属性组合,它在一个关系中作为主码。
- 超码(Super Key):可以唯一标识关系中每一行的属性或属性组合,可能包含多余的属性。
- 候选码(Candidate Key):最小的超码,即没有多余属性的超码。
3. 关系模型三要素
- 数据结构:关系模型中数据的组织方式。
- 数据操作:对数据进行的增、删、改、查等操作。
- 数据完整性约束:确保数据准确性和一致性的规则。
4. 关系代数
- 传统的集合运算:包括并、交、差等操作,用于对关系进行组合和比较。
- 专门的关系运算:包括选择(Selection)、投影(Projection)、连接(Join)、除(Division)等,用于更复杂的数据操作。
第三章结构化查询语言 SQL
1. 视图(View)
- 定义:视图是基于 SQL 语句的结果集的可视化表现,它是一个虚拟表,不实际存储数据,而是存储查询。
- 作用:提供数据的抽象和简化,增强安全性,以及作为复杂查询的存储。
2. 视图的优点
- 简化复杂查询:允许用户通过视图名称访问复杂查询的结果,而无需记住复杂的 SQL 语句。
- 安全性:可以限制用户访问数据库的某些部分,只允许他们看到视图中的数据。
- 逻辑数据独立性:在不影响视图的情况下,可以更改底层表的结构。
3. 查询视图
- 定义:通过 SQL 查询来检索视图中的数据。
- 操作:使用 SELECT 语句来查询视图,就像查询普通表一样。
4. 视图与基本表的区别
- 存储方式:基本表存储实际数据,而视图不存储数据,只存储查询。
- 性能:视图可能在性能上不如基本表,因为它们在查询时需要实时计算。
- 更新:视图可能不允许更新,或者更新操作有限制,这取决于视图的定义。
5. 创建和删除视图
- 创建视图:使用 CREATE VIEW 语句来定义视图,包括视图名称、查询语句等。
- 删除视图:使用 DROP VIEW 语句来删除不再需要的视图。
6. 数据定义
- 基本表的定义、修改和删除:涉及创建、修改和删除数据库中的基本表。
- 数据库的基本操作:包括数据的增删改查等操作。
- 索引的建立和删除:索引用于提高数据库查询性能,需要了解如何创建和删除索引。
7. 数据查询
- 单表查询:涉及 SELECT、FROM、WHERE、GROUP BY、HAVING 等子句。
- 连接查询:包括自身连接、多表连接、等值与非等值连接、外连接等。
- 嵌套查询:涉及带有比较运算符的子查询、带有 IN 谓词的子查询、带有 ANY 或 SOME 的子查询等。
- 基于派生表的查询:使用派生表(子查询)来构建更复杂的查询。
- 集合查询:使用 UNION、INTERSECT、EXCEPT 等操作符来组合多个查询结果。
第四章关系数据库编程
根据您提供的知识图谱,第四章的内容可以按照以下结构进行梳理:
1. 嵌入式 SQL(Embedded SQL)
- 定义:将 SQL 语句嵌入到宿主语言(如 C、COBOL、FORTRAN 等)程序中。
- 游标(Cursor):用于逐行处理查询结果的数据库对象。
- 主变量(Host Variable):宿主语言中的变量,用于存储或传递 SQL 语句中的参数。
2. 存储过程(Stored Procedure)
- 定义:存储在数据库中的一段预编译的 SQL 代码,可以包含逻辑和控制流语句。
- 存储过程的用户接口:如何调用存储过程以及传递参数。
- 存储过程的优点:包括性能提升、减少网络流量、封装业务逻辑等。
3. ODBC 编程(Open Database Connectivity)
- ODBC 工作流程:描述了使用 ODBC API 进行数据库操作的步骤。
- ODBC 工作原理:解释了 ODBC 如何作为应用程序和数据库之间的桥梁。
4. JDBC 编程(Java Database Connectivity)
- JDBC 工作流程:描述了使用 JDBC API 进行数据库操作的步骤。
- JDBC 工作原理:解释了 JDBC 如何作为 Java 应用程序和数据库之间的桥梁。
5. 游标(Cursor)
- 定义:在嵌入式 SQL 中,游标用于逐行处理查询结果。
- 作用:允许程序对查询结果进行更细粒度的控制。
6. 存储过程
- 存储过程的用户接口:如何定义和调用存储过程,以及如何传递参数。
- 存储过程的优点:包括提高性能、增强安全性、简化应用程序逻辑等。
7. ODBC 编程
- ODBC 工作流程:包括初始化环境、建立连接、执行 SQL 语句、处理结果和清理环境等步骤。
- ODBC 工作原理:ODBC 驱动管理器如何与数据库驱动程序交互,以及如何执行 SQL 语句。
8. JDBC 编程
- JDBC 工作流程:包括加载驱动、建立连接、创建语句、执行查询、处理结果和关闭连接等步骤。
- JDBC 工作原理:JDBC 驱动如何与数据库交互,以及如何执行 SQL 语句。
第五章数据库安全
1. 数据库安全性(Database Security)
- 定义:保护数据库免受未经授权的访问、使用、披露、破坏、修改或破坏的措施和实践。
2. 存取控制(Access Control)
- 自主存取控制(Discretionary Access Control, DAC):允许数据库用户(数据所有者)控制对数据的访问。
- 强制存取控制(Mandatory Access Control, MAC):由操作系统或安全内核控制对数据的访问,用户不能改变访问权限。
3. 数据库角色(Database Roles)
- 定义:数据库角色是一组权限的集合,可以分配给用户以简化权限管理。
- 作用:通过角色分配权限,可以更有效地管理用户权限。
4. 审计(Auditing)
- 定义:记录和检查数据库活动的过程,以确保合规性和检测潜在的安全威胁。
- 作用:帮助追踪数据库的访问和更改,以及进行安全分析。
5. 视图机制(View Mechanism)
- 定义:数据库视图是一个虚拟表,其内容由查询定义,用于提供数据的抽象视图。
- 作用:增强安全性,通过限制用户只能看到他们需要的数据。
6. 数据加密(Data Encryption)
- 定义:将数据转换为一种格式,使其在未经授权的情况下无法读取。
- 作用:保护数据在存储和传输过程中的安全性。
7. 授权(Authorization)
- 定义:根据用户的身份和角色,授予对数据库资源的访问权限的过程。
- 作用:确保只有合适的用户能够访问特定的数据。
8. 回收(Recovery)
- 定义:在数据丢失或损坏后恢复数据的过程。
- 作用:确保数据库的完整性和可用性,特别是在系统故障或灾难后。
第六章数据库完整性
根据您提供的知识图谱,第六章的内容可以按照以下结构进行梳理:
1. 数据库完整性(Database Integrity)
- 定义:确保数据库中数据的准确性和一致性的规则和约束。
2. 实体完整性(Entity Integrity)
- 定义:确保数据库表中每一行(实体)都有一个唯一标识符(主键)。
- 实体完整性检查和实施:确保每个表都有一个主键,且主键值不能为 NULL。
3. 参照完整性(Referential Integrity)
- 定义:确保数据库表之间的外键关系正确无误,即外键值必须对应于另一个表中的主键值。
- 参照完整性检查和实施:确保外键约束得到正确实施,以维护表之间的关系。
4. 用户自定义完整性(User-Defined Integrity)
- 定义:根据特定业务规则定义的完整性约束。
- 元组上的约束条件:针对表中的行(元组)的约束,如检查约束。
- 属性上的约束条件:针对表中列(属性)的约束,如非空约束、唯一约束、默认值等。
5. 触发器(Trigger)
- 定义:一种特殊的存储过程,它在特定的数据库事件(如 INSERT、UPDATE 或 DELETE)发生时自动执行。
- 激活触发器:在特定事件触发时,自动执行预定义的操作。
- 定义触发器:创建触发器的过程,包括指定触发条件和触发器的操作。
6. 完整性约束的实施
- 定义实体完整性:为表定义主键,确保实体的唯一性。
- 定义参照完整性:为表定义外键,确保数据之间的引用关系。
- 定义用户自定义完整性:根据业务需求定义额外的完整性规则。
7. 完整性约束的检查
- 实体完整性检查:检查主键是否唯一且不包含 NULL 值。
- 参照完整性检查:检查外键是否引用了有效的主键值。
8. 完整性约束的维护
- 维护实体完整性:确保数据插入和更新时遵守实体完整性规则。
- 维护参照完整性:确保数据插入、更新和删除时遵守参照完整性规则。
第七章并发控制
1. 事务(Transaction)
- 定义:事务是数据库中的一系列操作,这些操作要么全部成功,要么全部失败,是一个不可分割的工作单位。
- ACID 属性:
- 原子性(Atomicity):事务中的所有操作要么全部完成,要么全部不完成。
- 一致性(Consistency):事务必须使数据库从一个一致性状态转换到另一个一致性状态。
- 隔离性(Isolation):事务的执行不能被其他事务干扰。
- 持久性(Durability):一旦事务提交,它对数据库的修改就是永久的。
2. 并发操作问题(Concurrency Issues)
- 脏读(Dirty Read):一个事务读取了另一个未提交事务的数据。
- 不可重复读(Non-Repeatable Read):一个事务在两次读取同一数据时,数据被另一个事务修改。
- 丢失修改(Lost Update):两个事务同时更新同一数据,导致一个事务的更新被另一个事务覆盖。
3. 封锁(Locking)
- 定义:通过锁定数据来控制并发访问,防止数据不一致。
- 锁的类型:
- 排他锁(Exclusive Lock):允许持有锁的事务修改数据,其他事务不能读取或修改。
- 共享锁(Shared Lock):允许多个事务同时读取数据,但不允许修改。
4. 封锁粒度(Lock Granularity)
- 定义:锁定数据的粒度,可以是行级、页级或表级。
5. 封锁的工作原理(Locking Mechanism)
- 定义:如何通过锁定机制来实现并发控制。
6. 封锁协议(Locking Protocols)
- 定义:一组规则,用于确定事务如何请求和释放锁。
7. 并发控制(Concurrency Control)
- 定义:确保多个事务可以同时执行而不会导致数据不一致的机制。
第八章关系数据库规范化理论
1. 关系数据库的规范化理论(Normalization Theory)
- 定义:规范化是数据库设计过程中的一个重要步骤,旨在减少数据冗余和依赖性,提高数据的完整性。
2. 函数依赖(Functional Dependency)
- 函数依赖定义:数据库中属性之间的一种关系,其中一个属性的值可以唯一确定另一个属性的值。
- 平凡函数依赖:任何属性都函数依赖于任何超集。
- 非平凡函数依赖:非平凡属性之间的函数依赖。
- 部分依赖:在复合主键的情况下,如果一个属性只依赖于主键的一部分。
- 完全依赖:一个属性完全依赖于主键。
- 传递依赖:如果属性 A 依赖于属性 B,而属性 B 又依赖于属性 C,那么 A 传递依赖于 C。
3. 范式(Normal Form)
- 1 NF(第一范式):所有字段都是不可分割的基本数据项。
- 2 NF(第二范式):在 1 NF 的基础上,消除了非主属性对码的部分函数依赖。
- 3 NF(第三范式):在 2 NF 的基础上,消除了非主属性对码的传递函数依赖。
- BCNF(Boyce-Codd Normal Form):在 3 NF 的基础上,每个决定因素都包含候选码。
4. 模式分解(Schema Decomposition)
- 模式分解基础概念:将一个数据库模式分解为多个子模式的过程。
- Armstrong 公理:一组用于推导函数依赖的公理。
- 最小函数依赖集:在不改变函数依赖集的前提下,尽可能减少函数依赖的数量。
- 逻辑蕴含和闭包:用于确定一个函数依赖集是否逻辑蕴含另一个函数依赖。
- 闭包的计算:计算属性集的闭包,以确定它们可以确定哪些其他属性。
- 候选码的求解:找出能够唯一标识表中每一行的属性集。
5. 模式分解算法(Decomposition Algorithms)
- 无损连接分解:确保分解后的模式可以通过自然连接无损地重建原始模式。
- 保持函数依赖的分解:分解后的模式能够保持原始模式的所有函数依赖。
第九章关系数据库设计
需求分析->概念结构设计->逻辑结构设计->物理结构设计->数据库实施->维护
第十章 NoSQL
-
NoSQL 概述:
- NoSQL 数据库:指的是非关系型数据库,它们提供了一种存储和检索数据的方法,这种数据存储方法不仅限于传统的关系型数据库的表格模式。
- NoSQL 兴起的原因:这部分可能讨论了为什么需要 NoSQL 数据库,比如为了应对大规模数据、高并发、灵活的数据模型等需求。
-
NoSQL 的类型:
- 键值数据库:以键值对的形式存储数据,适合快速查询。
- 列值数据库:以列族的形式存储数据,适合处理大量列的数据。
- 文档数据库:存储文档(如 JSON 或 XML),适合存储复杂的数据结构。
- 图数据库:用于存储实体之间的关系,适合社交网络等需要处理复杂关系的场景。
-
NoSQL 的三大基石:
- BASE:Basically Available(基本可用)、Soft state(软状态)、Eventually consistent(最终一致性),这是 NoSQL 数据库的一致性模型,与关系型数据库的 ACID 模型相对。
- CAP 原则:Consistency(一致性)、Availability(可用性)、Partition tolerance(分区容错性),这三个特性在分布式系统中不可能同时完全满足,需要根据应用场景做出权衡。
- 最终一致性:一种数据一致性模型,允许数据在一段时间内不一致,但最终会达到一致状态。
第十一章 SQL 编程
数据库的基本操作
- 创建数据库
CREATE DATABASE database_name;
- 切换数据库
USE database_name;
- 修改数据库
ALTER DATABASE database_name CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
- 删除数据库
DROP DATABASE database_name;
基本表的定义、修改、删除
- 基本表的定义
CREATE TABLE table_name (column1 datatype CONSTRAINTS,column2 datatype CONSTRAINTS,...
);
数据类型 | 描述 |
---|---|
INT | 用于整数值。 |
VARCHAR(n) | 可变长度的字符串,最大长度为 n 。 |
TEXT | 用于长文本字符串。 |
DATE | 存储日期值(年、月、日)。 |
TIME | 存储时间值(时、分、秒)。 |
DATETIME | 存储日期和时间。 |
FLOAT | 浮点数,用于存储带小数的数值。 |
DOUBLE | 双精度浮点数,比 FLOAT 更精确。 |
BOOLEAN | 存储布尔值 (TRUE 或 FALSE )。 |
BLOB | 用于存储二进制数据。 |
- 基本表的增加
ALTER TABLE table_name ADD column_name datatype;
- 基本表的修改
ALTER TABLE table_name MODIFY COLUMN column_name new_datatype;
- 基本表的删除
DROP TABLE table_name;
索引的建立与删除
- 建立索引
CREATE INDEX index_name ON table_name (column1, column2, ...);
索引类型 | 描述 |
---|---|
PRIMARY KEY | 一个表中对应唯一记录的索引,不能包含 NULL 值。通常用于标识表中的唯一记录。 |
UNIQUE | 索引中的所有值都必须是唯一的,类似于主键,但可以有多个,并且可以接受 NULL 值。 |
INDEX | 普通索引,用来加速查询过程,无唯一性要求。可以为表中一个或多个列创建索引。 |
FULLTEXT | 专为全文搜索设计的索引,只适用于某些数据库系统如 MySQL。 |
SPATIAL | 用于地理数据存储的索引,可以快速处理空间数据查询。仅在支持该功能的数据库中可用。 |
FOREIGN KEY | 用于建立两个表之间的联系,指向另一个表中的主键。 |
- 删除索引
DROP INDEX index_name ON table_name;
数据更新
- 插入数据
INSERT INTO table_name (column1, column2, ...) VALUES (value1, value2, ...);
- 更新数据
UPDATE table_name SET column1 = value1, column2 = value2, ... WHERE condition;
- 删除数据
DELETE FROM table_name WHERE condition;
数据查询
单表查询
单表查询是数据库查询中最基础的形式,它仅涉及单个数据表。以下是单表查询中常用的 SQL 语句和子句:
- 基本的 SELECT 语句
最基本的单表查询使用SELECT
语句来选择表中的列。例如,选择employees
表中的name
和age
列:
SELECT name, age FROM employees;
- 使用 WHERE 子句进行条件过滤
WHERE
子句允许你根据条件过滤结果集。例如,选择年龄大于 30 岁的员工:
SELECT name, age FROM employees WHERE age > 30;
- 使用 ORDER BY 子句进行排序
ORDER BY
子句可以对结果进行排序,可以是升序(ASC)或降序(DESC)。例如,按年龄升序排列员工:
SELECT name, age FROM employees ORDER BY age ASC;
- 使用 GROUP BY 子句进行分组
GROUP BY
子句可以将结果集按一个或多个列的值进行分组。例如,按部门分组并计算每个部门的员工数量:
SELECT department, COUNT(*) FROM employees GROUP BY department;
- 使用 HAVING 子句进行分组后的条件过滤
HAVING
子句与WHERE
类似,但它是在分组后对结果集进行条件过滤。例如,选择员工数量超过 10 人的部门:
SELECT department, COUNT(*) FROM employees GROUP BY department HAVING COUNT(*) > 10;
- 使用 LIMIT 子句限制结果数量
LIMIT
子句用于限制查询结果的数量。例如,选择前 5 名员工:
SELECT name, age FROM employees LIMIT 5;
- 使用 AS 给列指定别名
AS
关键字允许你给列指定别名。例如,给员工年龄列指定别名为 age_years
:
SELECT name, age AS age_years FROM employees;
连接查询
连接查询(JOIN)用于结合两个或多个表中的行,这些表之间存在某种关系。最常用的连接类型包括内连接(INNER JOIN)、左连接(LEFT JOIN)、右连接(RIGHT JOIN)和全连接(FULL JOIN)。
内连接(INNER JOIN)
MySQL 中的内连接(INNER JOIN)有几种不同的写法,主要取决于你想要如何表达连接的条件。以下是一些常见的写法:
- 隐式内连接(使用 WHERE 子句):
SELECT column_name(s)FROM table1, table2WHERE table1.column_name = table2.column_name;
- 显式内连接(使用 INNER JOIN 关键字):
SELECT column_name(s)
FROM table1
INNER JOIN table2 ON table1.column_name = table2.column_name;```
3. **使用 USING 关键字**(当两个表中有相同名称的列时):
```sql
SELECT column_name(s)
FROM table1
INNER JOIN table2 USING (column_name);
- 使用 ON 关键字(指定连接条件):
SELECT column_name(s)
FROM table1
INNER JOIN table2 ON table1.column_name = table2.column_name;
- 使用别名(给表起别名以简化查询):
SELECT a.column_name, b.column_name
FROM table1 AS a
INNER JOIN table2 AS b ON a.id = b.id;
- 多表内连接(连接多个表):
SELECT a.column_name, b.column_name, c.column_name
FROM table1 AS a
INNER JOIN table2 AS b ON a.id = b.id
INNER JOIN table3 AS c ON b.id = c.id;
- 交叉连接(笛卡尔积,虽然不是内连接,但有时候也会用到):
SELECT *
FROM table1, table2;
左连接(LEFT JOIN)
- 使用 LEFT JOIN 关键字:
SELECT column_name(s)
FROM table1
LEFT JOIN table2 ON table1.column_name = table2.column_name;
- 使用别名:
SELECT a.column_name, b.column_name
FROM table1 AS a
LEFT JOIN table2 AS b ON a.id = b.id;
- 使用 USING 关键字(当两个表中有相同名称的列时):
SELECT column_name(s)
FROM table1
LEFT JOIN table2 USING (column_name);
右连接(RIGHT JOIN)
- 使用 RIGHT JOIN 关键字:
SELECT column_name(s)
FROM table1
RIGHT JOIN table2 ON table1.column_name = table2.column_name;
- 使用别名:
SELECT a.column_name, b.column_name
FROM table1 AS a
RIGHT JOIN table2 AS b ON a.id = b.id;
- 使用 USING 关键字(当两个表中有相同名称的列时):
SELECT column_name(s)
FROM table1
RIGHT JOIN table2 USING (column_name);
- 多表右连接(连接多个表):
SELECT a.column_name, b.column_name, c.column_name
FROM table1 AS a
RIGHT JOIN table2 AS b ON a.id = b.id
RIGHT JOIN table3 AS c ON b.id = c.id;
全连接(FULL JOIN)
全连接返回两个表中的所有行,无论它们是否匹配。如果一个表中没有匹配的行,则结果中该表的部分将为 NULL。
SELECT columns
FROM table1
FULL JOIN table2
ON table1.column_name = table2.column_name;
嵌套查询
嵌套查询,也称为子查询(Subquery),是嵌套在另一个查询中的 SQL 查询。它可以出现在 SELECT、INSERT、UPDATE 或 DELETE 语句中的任何地方。
IN
操作符
IN
操作符用于指定多个值的列表,子查询返回的值必须匹配列表中的一个值。
SELECT * FROM employees
WHERE department_id IN (SELECT department_id FROM departments WHERE location_id = 10);
这个查询返回所有在位置 ID 为 10 的部门工作的员工。
- 比较操作符
比较操作符包括 =
, <>
, >
, <
, >=
, <=
等,用于比较子查询返回的单个值。
SELECT * FROM employees
WHERE salary > (SELECT AVG(salary) FROM employees);
这个查询返回所有薪水高于平均薪水的员工。
ANY
或ALL
操作符
ANY
:如果子查询返回的任意一个值满足比较条件,则条件为真。ALL
:如果子查询返回的所有值都满足比较条件,则条件为真。
-- ANY
SELECT * FROM employees e1
WHERE e1.salary > ANY (SELECT salary FROM employees e2 WHERE e2.department_id = e1.department_id);-- ALL
SELECT * FROM employees e1
WHERE e1.salary > ALL (SELECT salary FROM employees e2 WHERE e2.department_id = e1.department_id AND e2.salary < 5000);
ANY
的查询返回薪水高于同部门任意员工的员工,而 ALL
的查询返回薪水高于同部门所有低薪水员工的员工。
4. EXISTS
操作符
EXISTS 代表存在量词∈,EXISTS
操作符用于检查子查询是否返回至少一个行。
SELECT * FROM employees e1
WHERE EXISTS (SELECT * FROM orders o WHERE o.employee_id = e1.employee_id);
这个查询返回至少有一个订单的员工。
集合查询
在 SQL 中,集合查询通常指的是使用集合操作符来组合多个查询结果集。这些操作符包括 UNION
、INTERSECT
和 EXCEPT
(或在某些数据库系统中使用 MINUS
)。以下是这些操作符的详细解释:
UNION
UNION
操作符用于合并两个或多个SELECT
语句的结果集,去除重复的行。
SELECT column_name(s) FROM table1
UNION
SELECT column_name(s) FROM table2;
这个查询返回 table1
和 table2
中所有不同的行。
2. INTERSECT
INTERSECT
操作符用于返回两个或多个 SELECT
语句共有的行。
SELECT column_name(s) FROM table1
INTERSECT
SELECT column_name(s) FROM table2;
这个查询返回同时存在于 table1
和 table2
中的行。
EXCEPT
(或MINUS
)
EXCEPT
操作符用于返回第一个查询中存在而第二个查询中不存在的行。在某些数据库系统中,如 Oracle,使用 MINUS
来实现相同的功能。
SELECT column_name(s) FROM table1
EXCEPT
SELECT column_name(s) FROM table2;
或者在 Oracle 中:
SELECT column_name(s) FROM table1
MINUS
SELECT column_name(s) FROM table2;
使用集合操作符的注意事项
- 选择列表一致性:在使用
UNION
、INTERSECT
或EXCEPT
时,每个查询的选择列表(即 SELECT 语句中指定的列)必须具有相同数量的列,并且相应的列数据类型必须兼容。 UNION
与UNION ALL
:UNION
默认去除重复的行,而UNION ALL
则保留所有行,包括重复的行。如果确定结果集中不会有重复行,或者你想要保留所有行,使用UNION ALL
可能会有更好的性能。- 性能:集合操作可能会影响数据库性能,尤其是当处理大量数据时。优化查询和索引可以提高性能。
- 可读性:合理使用集合操作符可以使查询更加清晰和易于理解。
视图
视图与基本表的区别
视图(View):
- 是一种虚拟存在的表,其内容由查询定义。
- 视图包含一系列带有名称的列和行数据,但并不在数据库中以存储的数据值集形式存在。
- 行和列数据来自由定义视图的查询所引用的表,并且在引用视图时动态生成。
- 视图不占用物理存储空间,它们是查询结果的可视化表示。
- 可以包含表的全部或部分记录,也可以由一个或多个表创建。
基本表(Base Table): - 是实际存储数据的表。
- 基本表包含实际的数据行和列,它们存在于数据库的物理存储中。
- 基本表的数据是持久化的,即使数据库关闭,数据也会被保留。
- 基本表可以进行各种数据操作,包括插入、更新、删除和查询。
视图的优点
- 简化复杂的 SQL 操作:通过将复杂的 SQL 查询封装为视图,可以简化业务逻辑和提高代码的可维护性。
- 安全性:可以为不同用户定制不同的视图,限制对特定数据的访问,提高安全性。
- 逻辑数据独立性:应用程序可以基于视图而不是基础表进行开发,当基础表结构变化时,可以通过修改视图来保持应用程序的稳定。
- 重构数据库提供了一定程度的逻辑独立性:视图可以在不影响应用程序的情况下对底层数据结构进行修改。
创建视图的基本语法如下:
CREATE VIEW view_name AS
SELECT column1, column2, ...
FROM table_name
WHERE condition;
如果要替换已存在的视图,可以使用 OR REPLACE
选项。
删除视图的语法如下:
DROP VIEW view_name;
使用 IF EXISTS
可以避免在视图不存在时出现错误。
3.6.4 查询视图
查询视图与查询普通表相同,使用 SELECT
语句:
SELECT * FROM view_name;
3.6.5 更新视图
更新视图通常指的是通过视图来插入、更新、删除表中的数据。但需要注意的是,并不是所有视图都可以更新。可更新的视图需要满足一定的条件,例如视图和基础表的行列之间存在一一对应关系。
更新视图的语法示例:
UPDATE view_name
SET column1 = value1, column2 = value2, ...
WHERE condition;
插入数据到视图:
INSERT INTO view_name (column1, column2, ...)
VALUES (value1, value2, ...);
删除视图中的数据:
DELETE FROM view_name
WHERE condition;
- 视图的更新操作实际上是对基础表的更新。
- 更新视图时,需要确保更新操作在视图的权限范围内。
- 视图的创建和删除只影响视图本身,不影响对应的基本表。