每天进步一点点之MySQL必知必会笔记

第一章 了解MySQL

1.1 数据库基础

1.1.1 什么是数据库

数据库:保存有组织的数据的容器(通常是一个文件或一组文件)。

数据库管理系统(DBMS):创建和管理数据库容器的工具。

一般我们使用的是DBMS

1.1.2 表

表:某种特定类型数据的结构化清单。

不要将不同种的数据存放在同一个表中。

数据库中每个表都有一个名字,用来标识自己。此名字是唯一的,这表示数据库中没有其他表具有相同的名字。

注:表名的唯一性取决于多个因素,如数据库名和表名等的结合。这表示,虽然在相同数据库中不能两次使用相同的表名,但在不同的数据库中却可以使用相同的表名。

表具有一些特性,这些特性定义了数据在表中如何存储,如可以存储什么样的数据,数据如何分解,各部分信息如何命名,等等。

模式: 关于数据库和表的布局及特性的信息。

注: 有时,模式用作数据库的同义词。遗憾的是,模式的含义通常在上下文中并不是很清晰。本书中,模式指的是上面给出的定义。

1.1.3 列和数据类型

表由列组成。列中存储着表中某部分的信息。

列( column):表中的一个字段。所有表都是由一个或多个列组成的。

数据类型( datatype) 所容许的数据的类型。每个表列都有相应的数据类型,它限制(或容许)该列中存储的数据。

注: 数据类型限制可存储在列中的数据种类(例如,防止在数值字段中录入字符值)。数据类型还帮助正确地排序数据,并在优化磁盘使用方面起重要的作用。因此,在创建表时必须对数据类型给予特别的关注。

1.1.4 行

表中的数据是按行存储的,所保存的每个记录存储在自己的行内。如果将表想象为网格,网格中垂直的列为表列,水平行为表行。

行( row):表中的一个记录。

1.1.5 主键

主键( primary key):一一列(或一组列),其值能够唯一区分表中每个行。

唯一标识表中每行的这个列(或这组列)称为主键。主键用来表示一个特定的行。没有主键,更新或删除表中特定行很困难,因为没有安全的方法保证只涉及相关的行。

应该总是定义主键,虽然并不总是都需要主键,但大多数数据库设计人员都应保证他们创建的每个表具有一个主键,以便于以后的数据操纵和管理。

表中的任何列都可以作为主键,只要它满足以下条件:(MySQL强制要求的)

 任意两行都不具有相同的主键值;
 每个行都必须具有一个主键值(主键列不允许NULL值)。

主键通常定义在表的一列上,但这并不是必需的,也可以一起使用多个列作为主键。在使用多列作为主键时,上述条件必须应用到构成主键的所有列,所有列值的组合必须是唯一的(但单个列的值可以不唯一)。

除MySQL强制实施的规则外,应该坚持的几个普遍认可的最好习惯为:

 不更新主键列中的值;
 不重用主键列的值;
 不在主键列中使用可能会更改的值。(例如,如果使用一个名字作为主键以标识某个供应商,当该供应商合并和更改其名字时,必须更改这个主键。)

1.2  什么是SQL

SQL (发音为字母S-Q-L或sequel)是结构化查询语言 ( Structured Query Language)的缩写。 SQL是一种专门用来与数据库通信的语言。

注:虽然SQL有标准委员会,但事实上任意两个DBMS实现的SQL都不完全相同。

第二章  MySQL简介

2.1 什么是MySQL

MySQL是一种DBMS,即它是一种数据库软件。

2.1.1 客户机—服务器软件

DBMS可分为两类:一类为基于共享文件系统的DBMS,另一类为基于客户机—服务器的DBMS。 显然MySQL属于后面一种。

客户机—服务器应用分为两个不同的部分。 服务器部分是负责所有数据访问和处理的一个软件。这个软件运行在称为数据库服务器的计算机上。

注: 与数据文件打交道的只有服务器软件。关于数据、数据添加、删除和数据更新的所有请求都由服务器软件完成。这些请求或更改来自运行客户机软件的计算机。 客户机是与用户打交道的软件。例如,如果你请求一个按字母顺序列出的产品表,则客户机软件通过网络提交该请求给服务器软件。服务器软件处理这个请求,根据需要过滤、丢弃和排序数据;然后把结果送回到你的客户机软件。

为了使用MySQL,你需要访问运行MySQL服务器软件的计算机和发布命令到MySQL的客户机软件的计算机。

 服务器软件为MySQL DBMS。你可以在本地安装的副本上运行,也可以连接到运行在你具有访问权的远程服务器上的一个副本。
 客户机可以是MySQL提供的工具、脚本语言(如Perl)、 Web应用开发语言(如ASP、 ColdFusion、 JSP和PHP)、程序设计语言(如C、 C++、 Java)等。

2.2 MySQL工具

2.2.1 mysql命令行实用程序

MySQL选项和参数: mysql -u 用户名 -p -h 主机名 -P 端口。

请注意:

 命令输入在mysql>之后;
 命令用;或\g结束,换句话说,仅按Enter不执行命令;
 输入help或\h获得帮助,也可以输入更多的文本获得特定命令的帮助(如,输入help select获得使用SELECT语句的帮助);
 输入quit或exit退出命令行实用程序。

第三章  使用MySQL

3.1 连接

为了连接到MySQL,需要以下信息:

 主机名(计算机名)——如果连接到本地MySQL服务器, 为localhost;

 端口(如果使用默认端口3306之外的端口);

 一个合法的用户名;

 用户口令(如果需要)。

就是上一章最后讲的内容,这里就不在赘述了。

3.2 选择数据库

在你能执行任意数据库操作前,需要选择一个数据库。为此,可使用USE关键字。

mysql> use learning
  Database changed

注: 记住,必须先使用USE打开数据库,才能读取其中的数据。

3.3 了解数据库和表

可用MySQL的SHOW命令来显示 数据库、表、列、用户、权限等的信息( MySQL从内部表中提取这些信息)。

mysql> show DATABASES;
+--------------------+
| Database           |
+--------------------+
| information_schema |
| learning           |
+--------------------+
2 rows in set (0.00 sec)

SHOW DATABASES;返回可用数据库的一个列表。包含在这个列表中的可能是MySQL内部使用的数据库(如例子中的mysql和information_schema)。

mysql> SHOW TABLES;
+--------------------+
| Tables_in_learning |
+--------------------+
| customers          |
| orderitems         |
| orders             |
| productnotes       |
| products           |
| vendors            |
+--------------------+
6 rows in set (0.00 sec)

SHOW TABLES;返回当前选择的数据库内可用表的列表。

mysql> show columns from customers;
+--------------+-----------+------+-----+---------+----------------+
| Field        | Type      | Null | Key | Default | Extra          |
+--------------+-----------+------+-----+---------+----------------+
| cust_id      | int(11)   | NO   | PRI | NULL    | auto_increment |
| cust_name    | char(50)  | NO   |     | NULL    |                |
| cust_address | char(50)  | YES  |     | NULL    |                |
| cust_city    | char(50)  | YES  |     | NULL    |                |
| cust_state   | char(5)   | YES  |     | NULL    |                |
| cust_zip     | char(10)  | YES  |     | NULL    |                |
| cust_country | char(50)  | YES  |     | NULL    |                |
| cust_contact | char(50)  | YES  |     | NULL    |                |
| cust_email   | char(255) | YES  |     | NULL    |                |
+--------------+-----------+------+-----+---------+----------------+
9 rows in set (0.00 sec)

SHOW COLUMNS 要 求 给 出 一 个 表 名 ( 这 个 例 子 中 的 FROMcustomers),它对每个字段返回一行,行中包含字段名、数据类型、是否允许NULL、键信息、默认值以及其他信息(如字段cust_id的auto_increment)。

注: MySQL支持用DESCRIBE作为SHOW COLUMNS FROM的一种快捷方式。换句话说, DESCRIBE customers;是SHOW COLUMNS FROM customers;的一种快捷方式。

所支持的其他SHOW语句还有:

 SHOW STATUS,用于显示广泛的服务器状态信息;
 SHOW CREATE DATABASE和SHOW CREATE TABLE,分别用来显示创
建特定数据库或表的MySQL语句;
 SHOW GRANTS,用来显示授予用户(所有用户或特定用户)的安
全权限;
 SHOW ERRORS和SHOW WARNINGS, 用来显示服务器错误或警告消息。

注:可以在mysql命令行实用程序中,执行命令HELP SHOW;显示允许的SHOW语句。

第四章 检 索 数 据

4.1 SELECT语句

SELECT语句了。它的用途是从一个或多个表中检索信息。为了使用SELECT检索表数据,必须至少给出两条信息——想选择什么,以及从什么地方选择。

4.2 检索单个列

mysql> select prod_name from products;
+----------------+
| prod_name      |
+----------------+
| .5 ton anvil   |
| 1 ton anvil    |
| 2 ton anvil    |
| Detonator      |
| Bird seed      |
| Carrots        |
| Fuses          |
| JetPack 1000   |
| JetPack 2000   |
| Oil can        |
| Safe           |
| Sling          |
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
14 rows in set (0.00 sec)

上述语句利用 SELECT语句从 products表中检索一个名为prod_name的列。所需的列名在SELECT关键字之后给出, FROM关键字指出从其中检索数据的表名。

注: 多条SQL语句必须以分号(;)分隔。 MySQL如同多数DBMS一样,不需要在单条SQL语句后加分号。但特定的DBMS可能必须在单条SQL语句后加上分号。当然,如果愿意可以总是加上分号。事实上,即使不一定需要,但加上分号肯定没有坏处。如果你使用的是mysql命令行,必须加上分号来结束SQL语句。

SQL语句和大小写 请注意, SQL语句不区分大小写,因此SELECT与select是相同的。同样,写成Select也没有关系。许多SQL开发人员喜欢对所有SQL关键字使用大写,而对所有列和表名使用小写,这样做使代码更易于阅读和调试。

不过,一定要认识到虽然SQL是不区分大小写的,但有些标识符(如数据库名、表名、列名)可能不同:在MySQL 4.1及之前的版本中,这些标识符默认是区分大小写的;在MySQL 4.1.1版本中,这些标识符默认是不区分大小写的。最佳方式是按照大小写的惯例,且使用时保持一致。

使用空格:在处理SQL语句时,其中所有空格都被忽略。 SQL语句可以在一行上给出,也可以分成许多行。多数SQL开发人员认为将SQL语句分成多行更容易阅读和调试。

4.3 检索多个列

在选择多个列时,一定要在列名之间加上逗号,但最后一个列名后不加。如果在最后一个列名后加了逗号,将出现错误。

mysql> select prod_id,prod_name,prod_price from products;
+---------+----------------+------------+
| prod_id | prod_name      | prod_price |
+---------+----------------+------------+
| ANV01   | .5 ton anvil   |       5.99 |
| ANV02   | 1 ton anvil    |       9.99 |
| ANV03   | 2 ton anvil    |      14.99 |
| DTNTR   | Detonator      |      13.00 |
| FB      | Bird seed      |      10.00 |
| FC      | Carrots        |       2.50 |
| FU1     | Fuses          |       3.42 |
| JP1000  | JetPack 1000   |      35.00 |
| JP2000  | JetPack 2000   |      55.00 |
| OL1     | Oil can        |       8.99 |
| SAFE    | Safe           |      50.00 |
| SLING   | Sling          |       4.49 |
| TNT1    | TNT (1 stick)  |       2.50 |
| TNT2    | TNT (5 sticks) |      10.00 |
+---------+----------------+------------+
14 rows in set (0.00 sec)

4.4 检索所有列

如果给定一个通配符( *),则返回表中所有列。列的顺序一般是列在表定义中出现的顺序。但有时候并不是这样的,表的模式的变化(如添加或删除列)可能会导致顺序的变化。

mysql> select * from orders;
+-----------+---------------------+---------+
| order_num | order_date          | cust_id |
+-----------+---------------------+---------+
|     20005 | 2005-09-01 00:00:00 |   10001 |
|     20006 | 2005-09-12 00:00:00 |   10003 |
|     20007 | 2005-09-30 00:00:00 |   10004 |
|     20008 | 2005-10-03 00:00:00 |   10005 |
|     20009 | 2005-10-08 00:00:00 |   10001 |
+-----------+---------------------+---------+
5 rows in set (0.00 sec)

使用通配符 一般,除非你确实需要表中的每个列,否则最好别使用*通配符。虽然使用通配符可能会使你自己省事,不用明确列出所需列,但检索不需要的列通常会降低检索和应用程序的性能。

检索未知列:使用通配符有一个大优点。由于不明确指定列名(因为星号检索每个列),所以能检索出名字未知的列。

4.5 检索不同的行

想要得到值不同的行,解决办法是使用DISTINCT关键字,顾名思义,此关键字指示MySQL只返回不同的值。

mysql> select DISTINCT vend_id from products;
+---------+
| vend_id |
+---------+
|    1001 |
|    1002 |
|    1003 |
|    1005 |
+---------+
4 rows in set (0.00 sec)

注: DISTINCT关键字,它必须直接放在列名的前面。

不能部分使用DISTINCT DISTINCT关键字应用于所有列而不仅是前置它的列。如果给出SELECT DISTINCT vend_id,prod_price,除非指定的两个列都相同,否则所有行都将被检索出来。

mysql> select DISTINCT vend_id,prod_price from products;
+---------+------------+
| vend_id | prod_price |
+---------+------------+
|    1001 |       5.99 |
|    1001 |       9.99 |
|    1001 |      14.99 |
|    1003 |      13.00 |
|    1003 |      10.00 |
|    1003 |       2.50 |
|    1002 |       3.42 |
|    1005 |      35.00 |
|    1005 |      55.00 |
|    1002 |       8.99 |
|    1003 |      50.00 |
|    1003 |       4.49 |
+---------+------------+
12 rows in set (0.00 sec)

4.6 限制结果

SELECT语句返回所有匹配的行,它们可能是指定表中的每个行。为了返回第一行或前几行,可使用LIMIT子句。

mysql> select prod_name from products limit 5;
+--------------+
| prod_name    |
+--------------+
| .5 ton anvil |
| 1 ton anvil  |
| 2 ton anvil  |
| Detonator    |
| Bird seed    |
+--------------+
5 rows in set (0.00 sec)

也可以指定开始的行数

mysql> select prod_name from products limit 5, 5;
+--------------+
| prod_name    |
+--------------+
| Carrots      |
| Fuses        |
| JetPack 1000 |
| JetPack 2000 |
| Oil can      |
+--------------+
5 rows in set (0.00 sec)

LIMIT 5, 5指示MySQL返回从行5开始的5行。第一个数为开始位置,第二个数为要检索的行数。

所以, 带一个值的LIMIT总是从第一行开始,给出的数为返回的行数。带两个值的LIMIT可以指定从行号为第一个值的位置开始。

行0:检索出来的第一行为行0而不是行1。因此, LIMIT 1, 1将检索出第二行而不是第一行。

在行数不够时:LIMIT中指定要检索的行数为检索的最大行数。如果没有足够的行(例如,给出LIMIT 10, 5,但只有13行), MySQL将只返回它能返回的那么多行。

MySQL 5支持LIMIT的另一种替代语法。 LIMIT4 OFFSET 3意为从行3开始取4行,就像LIMIT 3, 4一样。

4.7 使用完全限定的表名

完全限定的列名就是同时使用表名和列名标识一个列。

mysql> select products.prod_name from products;
+----------------+
| prod_name      |
+----------------+
| .5 ton anvil   |
| 1 ton anvil    |
| 2 ton anvil    |
| Detonator      |
| Bird seed      |
| Carrots        |
| Fuses          |
| JetPack 1000   |
| JetPack 2000   |
| Oil can        |
| Safe           |
| Sling          |
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
14 rows in set (0.00 sec)

完全限定的表名就是同时使用数据库名和表名标识一个表。

mysql> select products.prod_name from learning.products;
+----------------+
| prod_name      |
+----------------+
| .5 ton anvil   |
| 1 ton anvil    |
| 2 ton anvil    |
| Detonator      |
| Bird seed      |
| Carrots        |
| Fuses          |
| JetPack 1000   |
| JetPack 2000   |
| Oil can        |
| Safe           |
| Sling          |
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
14 rows in set (0.00 sec)

第五章 排序检索数据

5.1 排序数据

检索出的数据并不是以纯粹的随机顺序显示的。如果不排序,数据一般将以它在底层表中出现的顺序显示。这可以是数据最初添加到表中的顺序。但是,如果数据后来进行过更新或删除,则此顺序将会受到MySQL重用回收存储空间的影响。

因此,如果不明确控制的话,不能(也不应该)依赖该排序顺序。

关系数据库设计理论认为,如果不明确规定排序顺序,则不应该假定检索出的数据的顺序有意义。

为了明确地排序用SELECT语句检索出的数据,可使用ORDER BY子句。ORDER BY子句取一个或多个列的名字,据此对输出进行排序。

mysql> select prod_name from products order by prod_name;
+----------------+
| prod_name      |
+----------------+
| .5 ton anvil   |
| 1 ton anvil    |
| 2 ton anvil    |
| Bird seed      |
| Carrots        |
| Detonator      |
| Fuses          |
| JetPack 1000   |
| JetPack 2000   |
| Oil can        |
| Safe           |
| Sling          |
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
14 rows in set (0.00 sec)

通过非选择列进行排序:通常, ORDER BY子句中使用的列将是为显示所选择的列。但是,实际上并不一定要这样,用非检索的列排序数据是完全合法的。

5.2 按多个列排序

mysql> select prod_id, prod_price, prod_name from products order by prod_price,prod_name;
+---------+------------+----------------+
| prod_id | prod_price | prod_name      |
+---------+------------+----------------+
| FC      |       2.50 | Carrots        |
| TNT1    |       2.50 | TNT (1 stick)  |
| FU1     |       3.42 | Fuses          |
| SLING   |       4.49 | Sling          |
| ANV01   |       5.99 | .5 ton anvil   |
| OL1     |       8.99 | Oil can        |
| ANV02   |       9.99 | 1 ton anvil    |
| FB      |      10.00 | Bird seed      |
| TNT2    |      10.00 | TNT (5 sticks) |
| DTNTR   |      13.00 | Detonator      |
| ANV03   |      14.99 | 2 ton anvil    |
| JP1000  |      35.00 | JetPack 1000   |
| SAFE    |      50.00 | Safe           |
| JP2000  |      55.00 | JetPack 2000   |
+---------+------------+----------------+
14 rows in set (0.00 sec)

重要的是理解在按多个列排序时,排序完全按所规定的顺序进行。换句话说,对于上述例子中的输出,仅在多个行具有相同的prod_price值时才对产品按prod_name进行排序。如果prod_price列中所有的值都是唯一的,则不会按prod_name排序。

5.3 指定排序方向

进行降序排序,必须指定DESC关键字。

mysql> select prod_id,prod_price,prod_name from products order by prod_price desc;
+---------+------------+----------------+
| prod_id | prod_price | prod_name      |
+---------+------------+----------------+
| JP2000  |      55.00 | JetPack 2000   |
| SAFE    |      50.00 | Safe           |
| JP1000  |      35.00 | JetPack 1000   |
| ANV03   |      14.99 | 2 ton anvil    |
| DTNTR   |      13.00 | Detonator      |
| FB      |      10.00 | Bird seed      |
| TNT2    |      10.00 | TNT (5 sticks) |
| ANV02   |       9.99 | 1 ton anvil    |
| OL1     |       8.99 | Oil can        |
| ANV01   |       5.99 | .5 ton anvil   |
| SLING   |       4.49 | Sling          |
| FU1     |       3.42 | Fuses          |
| FC      |       2.50 | Carrots        |
| TNT1    |       2.50 | TNT (1 stick)  |
+---------+------------+----------------+
14 rows in set (0.00 sec)

对多个列排序:

mysql> select prod_id,prod_price,prod_name from products order by prod_price desc, prod_name;
+---------+------------+----------------+
| prod_id | prod_price | prod_name      |
+---------+------------+----------------+
| JP2000  |      55.00 | JetPack 2000   |
| SAFE    |      50.00 | Safe           |
| JP1000  |      35.00 | JetPack 1000   |
| ANV03   |      14.99 | 2 ton anvil    |
| DTNTR   |      13.00 | Detonator      |
| FB      |      10.00 | Bird seed      |
| TNT2    |      10.00 | TNT (5 sticks) |
| ANV02   |       9.99 | 1 ton anvil    |
| OL1     |       8.99 | Oil can        |
| ANV01   |       5.99 | .5 ton anvil   |
| SLING   |       4.49 | Sling          |
| FU1     |       3.42 | Fuses          |
| FC      |       2.50 | Carrots        |
| TNT1    |       2.50 | TNT (1 stick)  |
+---------+------------+----------------+
14 rows in set (0.00 sec)

DESC关键字只应用到直接位于其前面的列名。 在多个列上降序排序 如果想在多个列上进行降序排序, 必须对每个列指定DESC关键字。

与DESC相反的关键字是ASC ( ASCENDING),在升序排序时可以指定它。升序是排序时默认的。

区分大小写和排序顺序 在对文本性的数据进行排序时, A与a相同吗? a位于B之前还是位于Z之后?这些问题不是理论问题,其答案取决于数据库如何设置。
在字典 ( dictionary)排序顺序中,A被视为与a相同,这是MySQL(和大多数数据库管理系统)的默认行为。但是,许多数据库管理员能够在需要时改变这种行为(如果你的数据库包含大量
外语字符,可能必须这样做)。
这里,关键的问题是,如果确实需要改变这种排序顺序,用简单的ORDER BY子句做不到。你必须请求数据库管理员的帮助。

使用ORDER BY和LIMIT的组合,能够找出一个列中最高或最低的值。如:

mysql> select prod_price from products order by prod_price desc limit 1;
+------------+
| prod_price |
+------------+
|      55.00 |
+------------+
1 row in set (0.00 sec)

ORDER BY子句的位置 在给出ORDER BY子句时,应该保证它位于FROM子句之后。如果使用LIMIT,它必须位于ORDER BY之后。使用子句的次序不对将产生错误消息。

第六章 过滤数据

6.1 使用WHERE子句

在SELECT语句中,数据根据WHERE子句中指定的搜索条件进行过滤。WHERE子句在表名( FROM子句)之后给出。

mysql> select prod_name,prod_price from products where prod_price=2.5;
+---------------+------------+
| prod_name     | prod_price |
+---------------+------------+
| Carrots       |       2.50 |
| TNT (1 stick) |       2.50 |
+---------------+------------+
2 rows in set (0.00 sec)

SQL过滤与应用过滤:数据也可以在应用层过滤。为此目的, SQL的SELECT语句为客户机应用检索出超过实际所需的数据,然后客户机代码对返回数据进行循环,以提取出需要的行。但是,这种做法极度影响了效率。 并且使所创建的应用完全不具备可伸缩性。此外,如果在客户机上过滤数据,服务器不得不通过网络发送多余的数据,这将导致网络带宽的浪费。

WHERE子句的位置 在同时使用ORDER BY和WHERE子句时,应该让ORDER BY位于WHERE之后, 否则将会产生错误。

6.2 WHERE子句操作符

MySQL支持下表列出的所有条件操作符。

操 作 符 说 明
= 等于
<>  不等于
!= 不等于
小于
<= 小于等于
大于
>= 大于等于
BETWEEN 在指定的两个值之间

6.2.1 检查单个值

mysql> select prod_name, prod_price from products where prod_name='fuses';
+-----------+------------+
| prod_name | prod_price |
+-----------+------------+
| Fuses     |       3.42 |
+-----------+------------+
1 row in set (0.00 sec)

MySQL在执行匹配时默认不区分大小写,所以fuses与Fuses匹配。

小于的例子:

mysql> select prod_name, prod_price from products where prod_price<10;
+---------------+------------+
| prod_name     | prod_price |
+---------------+------------+
| .5 ton anvil  |       5.99 |
| 1 ton anvil   |       9.99 |
| Carrots       |       2.50 |
| Fuses         |       3.42 |
| Oil can       |       8.99 |
| Sling         |       4.49 |
| TNT (1 stick) |       2.50 |
+---------------+------------+
7 rows in set (0.00 sec)

小于等于的例子:

mysql> select prod_name, prod_price from products where prod_price<=10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| .5 ton anvil   |       5.99 |
| 1 ton anvil    |       9.99 |
| Bird seed      |      10.00 |
| Carrots        |       2.50 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Sling          |       4.49 |
| TNT (1 stick)  |       2.50 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
9 rows in set (0.00 sec)

6.2.2 不匹配检查

mysql> select vend_id,prod_name from products where vend_id<>1003;
+---------+--------------+
| vend_id | prod_name    |
+---------+--------------+
|    1001 | .5 ton anvil |
|    1001 | 1 ton anvil  |
|    1001 | 2 ton anvil  |
|    1002 | Fuses        |
|    1005 | JetPack 1000 |
|    1005 | JetPack 2000 |
|    1002 | Oil can      |
+---------+--------------+
7 rows in set (0.00 sec)

何时使用引号:单引号用来限定字符串。如果将值与串类型的列进行比较,则需要限定引号。用来与数值列进行比较的值不用引号。

mysql> select vend_id,prod_name from products where vend_id!=1003;
+---------+--------------+
| vend_id | prod_name    |
+---------+--------------+
|    1001 | .5 ton anvil |
|    1001 | 1 ton anvil  |
|    1001 | 2 ton anvil  |
|    1002 | Fuses        |
|    1005 | JetPack 1000 |
|    1005 | JetPack 2000 |
|    1002 | Oil can      |
+---------+--------------+
7 rows in set (0.00 sec)

6.2.3 范围值检查

为了检查某个范围的值,可使用BETWEEN操作符。其语法与其他WHERE子句的操作符稍有不同,因为它需要两个值,即范围的开始值和结束值。

mysql> select prod_name,prod_price from products where prod_price between 5 and 10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| .5 ton anvil   |       5.99 |
| 1 ton anvil    |       9.99 |
| Bird seed      |      10.00 |
| Oil can        |       8.99 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
5 rows in set (0.00 sec)

在使用BETWEEN时,必须指定两个值——所需范围的低端值和高端值。这两个值必须用AND关键字分隔。 BETWEEN匹配范围中所有的值,包括指定的开始值和结束值。

6.2.4 空值检查

在创建表时,表设计人员可以指定其中的列是否可以不包含值。在一个列不包含值时,称其为包含空值NULL。

NULL:无值( no value),它与字段包含0、空字符串或仅仅包含空格不同。

SELECT语句有一个特殊的WHERE子句,可用来检查具有NULL值的列。这个WHERE子句就是IS NULL子句。

mysql> select cust_id from customers where cust_email is null;
+---------+
| cust_id |
+---------+
|   10002 |
|   10005 |
+---------+
2 rows in set (0.00 sec)

NULL与不匹配 在通过过滤选择出不具有特定值的行时,你可能希望返回具有NULL值的行。但是,不行。因为未知具有特殊的含义,数据库不知道它们是否匹配,所以在匹配过滤或不匹配过滤时不返回它们。

因此,在过滤数据时,一定要验证返回数据中确实给出了被过滤列具有NULL的行。

mysql> select cust_id,cust_email from customers where cust_email<>'sam@yosemite.com';
+---------+---------------------+
| cust_id | cust_email          |
+---------+---------------------+
|   10001 | ylee@coyote.com     |
|   10003 | rabbit@wascally.com |
+---------+---------------------+
2 rows in set (0.01 sec)

第七章 数据过滤

7.1 组合WHERE子句

7.1.1 AND操作符

为了进行更强的过滤控制, MySQL允许给出多个WHERE子句。这些子句可以两种方式使用:以AND子句的方式或OR子句的方式使用。

操作符( operator):用来联结或改变WHERE子句中的子句的关键字。也称为逻辑操作符( logical operator) 。

mysql> select prod_id,prod_price,prod_name from products where vend_id=1003 and prod_price<=10;
+---------+------------+----------------+
| prod_id | prod_price | prod_name      |
+---------+------------+----------------+
| FB      |      10.00 | Bird seed      |
| FC      |       2.50 | Carrots        |
| SLING   |       4.49 | Sling          |
| TNT1    |       2.50 | TNT (1 stick)  |
| TNT2    |      10.00 | TNT (5 sticks) |
+---------+------------+----------------+
5 rows in set (0.01 sec)

这条SELECT语句中的WHERE子句包含两个条件,并且用AND关键字联结它们。 AND指示DBMS只返回满足所有给定条件的行。

AND:用在WHERE子句中的关键字,用来指示检索满足所有给定条件的行。

上述例子中使用了只包含一个关键字AND的语句,把两个过滤条件组合在一起。还可以添加多个过滤条件,每添加一条就要使用一个AND。

7.1.2 OR操作符

OR操作符与AND操作符不同,它指示MySQL检索匹配任一条件的行。

OR操作符告诉DBMS匹配任一条件而不是同时匹配两个条件。

mysql> select prod_name,prod_price from products where vend_id=1002 or vend_id=1003;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Detonator      |      13.00 |
| Bird seed      |      10.00 |
| Carrots        |       2.50 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Safe           |      50.00 |
| Sling          |       4.49 |
| TNT (1 stick)  |       2.50 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
9 rows in set (0.00 sec)

OR:WHERE子句中使用的关键字,用来表示检索匹配任一给定条件的行。

7.1.3 计算次序——and 和or的计算优先级

mysql> select prod_name,prod_price from products where vend_id=1002 or vend_id=1003 and prod_price>=10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Detonator      |      13.00 |
| Bird seed      |      10.00 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Safe           |      50.00 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
6 rows in set (0.00 sec)

出现上述情况是由于SQL(像多数语言一样)在处理OR操作符前,优先处理AND操作符。就是and的优先级高于or。

此问题的解决方法是使用圆括号明确地分组相应的操作符。请看下面的SELECT语句及输出:

mysql> select prod_name,prod_price from products where (vend_id=1002 or vend_id=1003) and prod_price>=10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Detonator      |      13.00 |
| Bird seed      |      10.00 |
| Safe           |      50.00 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
4 rows in set (0.00 sec)

在上述例子中, 由于圆括号具有较AND或OR操作符高的计算次序, DBMS首先过滤圆括号内的OR条件。

在WHERE子句中使用圆括号 任何时候使用具有AND和OR操作符的WHERE子句,都应该使用圆括号明确地分组操作符。不要过分依赖默认计算次序,即使它确实是你想要的东西也是如此。使用圆括号没有什么坏处,它能消除歧义。

7.2 IN操作符

IN操作符用来指定条件范围,范围中的每个条件都可以进行匹配。 IN取合法值的由逗号分隔的清单,全都括在圆括号中。

mysql> select prod_name,prod_price from products where vend_id in (1002, 1003) order by prod_name;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Bird seed      |      10.00 |
| Carrots        |       2.50 |
| Detonator      |      13.00 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Safe           |      50.00 |
| Sling          |       4.49 |
| TNT (1 stick)  |       2.50 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
9 rows in set (0.00 sec)

IN操作符完成与OR相同的功能

为什么要使用IN操作符?其优点具体如下。
 在使用长的合法选项清单时, IN操作符的语法更清楚且更直观。
 在使用IN时,计算的次序更容易管理(因为使用的操作符更少)。
 IN操作符一般比OR操作符清单执行更快。
 IN的最大优点是可以包含其他SELECT语句,使得能够更动态地建立WHERE子句。第14章将对此进行详细介绍。

IN WHERE子句中用来指定要匹配值的清单的关键字,功能与OR相当。

7.3 NOT操作符

WHERE子句中的NOT操作符有且只有一个功能,那就是否定它之后所跟的任何条件。 NOT WHERE子句中用来否定后跟条件的关键字。

mysql> select prod_name,prod_price from products where vend_id not in (1002, 1003) order by prod_name;
+--------------+------------+
| prod_name    | prod_price |
+--------------+------------+
| .5 ton anvil |       5.99 |
| 1 ton anvil  |       9.99 |
| 2 ton anvil  |      14.99 |
| JetPack 1000 |      35.00 |
| JetPack 2000 |      55.00 |
+--------------+------------+
5 rows in set (0.00 sec)

MySQL中的 NOT MySQL 支 持 使 用 NOT 对 IN 、 BETWEEN 和EXISTS子句取反,这与多数其他DBMS允许使用NOT对各种条件取反有很大的差别

第八章 用通配符进行过滤

8.1 LIKE操作符

通配符( wildcard) 用来匹配值的一部分的特殊字符。

搜索模式( search pattern)由字面值、通配符或两者组合构成的搜索条件。

为在搜索子句中使用通配符,必须使用LIKE操作符。 LIKE指示MySQL,后跟的搜索模式利用通配符匹配而不是直接相等匹配进行比较。

谓词 操作符何时不是操作符?答案是在它作为谓词( predicate)时。从技术上说, LIKE是谓词而不是操作符。虽然最终的结果是相同的,但应该对此术语有所了解,以免在SQL文档中遇到此术语时不知道。

8.1.1 百分号( %)通配符

最常使用的通配符是百分号( %)。在搜索串中, %表示任何字符出现任意次数。

mysql> select prod_id, prod_name from products where prod_name like 'jet%';
+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| JP1000  | JetPack 1000 |
| JP2000  | JetPack 2000 |
+---------+--------------+
2 rows in set (0.00 sec)

%告诉MySQL接受jet之后的任意字符,不管它有多少字符。

区分大小写:根据MySQL的配置方式,搜索可以是区分大小写的。如果区分大小写, ‘jet%’与JetPack 1000将不匹配。

通配符可在搜索模式中任意位置使用,并且可以使用多个通配符。

mysql> select prod_id, prod_name from products where prod_name like '%anvil%';
+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| ANV01   | .5 ton anvil |
| ANV02   | 1 ton anvil  |
| ANV03   | 2 ton anvil  |
+---------+--------------+
3 rows in set (0.00 sec)

通配符也可以出现在搜索模式的中间,虽然这样做不太有用。下面的例子找出以s起头以e结尾的所有产品:

mysql> select prod_name from products where prod_name like 's%e';
+-----------+
| prod_name |
+-----------+
| Safe      |
+-----------+
1 row in set (0.00 sec)

重要的是要注意到,除了一个或多个字符外, %还能匹配0个字符。 %代表搜索模式中给定位置的0个、 1个或多个字符。

注意尾空格 尾空格可能会干扰通配符匹配。例如,在保存词anvil 时 , 如 果 它 后 面 有 一 个 或 多 个 空 格 , 则 子 句 WHEREprod_name LIKE ‘%anvil’将不会匹配它们,因为在最后的l后有多余的字符。解决这个问题的一个简单的办法是在搜索模式最后附加一个%。一个更好的办法是使用函数(第11章将会介绍)去掉首尾空格。

注意NULL:虽然似乎%通配符可以匹配任何东西,但有一个例外,即NULL。即使是WHERE prod_name LIKE ‘%’也不能匹配用值NULL作为产品名的行。

8.1.2 下划线( _)通配符

另一个有用的通配符是下划线( _)。下划线的用途与%一样,但下划线只匹配单个字符而不是多个字符。

mysql> select prod_id,prod_name from products where prod_name like '_ ton anvil';
+---------+-------------+
| prod_id | prod_name   |
+---------+-------------+
| ANV02   | 1 ton anvil |
| ANV03   | 2 ton anvil |
+---------+-------------+
2 rows in set (0.00 sec)

.5 ton anvil产品没有匹配,因为搜索模式要求匹配两个通配符而不是一个。对照一下,下面的SELECT语句使用%通配符,返回三行产品:

mysql> select prod_id,prod_name from products where prod_name like '% ton anvil';
+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| ANV01   | .5 ton anvil |
| ANV02   | 1 ton anvil  |
| ANV03   | 2 ton anvil  |
+---------+--------------+
3 rows in set (0.00 sec)

与%能匹配0个字符不一样, _总是匹配一个字符,不能多也不能少。

8.2 使用通配符的技巧

通配符搜索的处理一般要比前面讨论的其他搜索所花时间更长。这里给出一些使用通配符要记住的技巧。

 不要过度使用通配符。如果其他操作符能达到相同的目的,应该使用其他操作符。
 在确实需要使用通配符时,除非绝对有必要,否则不要把它们用在搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
 仔细注意通配符的位置。如果放错地方,可能不会返回想要的数据。

第九章 用正则表达式进行搜索

9.2 使用MySQL正则表达式

MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定正则表达式,过滤SELECT检索出的数据。

仅为正则表达式语言的一个子集:如果你熟悉正则表达式, 需要注意: MySQL仅支持多数正则表达式实现的一个很小的子集。

9.2.1 基本字符匹配

mysql> select prod_name from products where prod_name regexp '1000' order by prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
+--------------+
1 row in set (0.00 sec)
mysql> select prod_name from products where prod_name regexp '.000' order by prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+
2 rows in set (0.00 sec)

这里使用了正则表达式.000。 .是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符。

LIKE与REGEXP 在LIKE和REGEXP之间有一个重要的差别。请看以下两条语句:

mysql> select prod_name from products where prod_name like '1000' order by prod_name;
  Empty set (0.00 sec)
mysql> select prod_name from products where prod_name regexp '1000' order by prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
+--------------+
1 row in set (0.00 sec)

LIKE匹配整个列。如果被匹配的文本在列值中出现, LIKE将不会找到它,相应的行也不被返回(除非使用通配符)。而REGEXP在列值内进行匹配,如果被匹配的文本在列值中出现, REGEXP将会找到它,相应的行将被返回。这是一个非常重要的差别。

匹配不区分大小写 MySQL中的正则表达式匹配(自版本3.23.4后)不区分大小写(即,大写和小写都匹配)。为区分大小写,可使用BINARY关键字,如WHERE prod_name REGEXPBINARY ‘JetPack .000’。

9.2.2 进行OR匹配

为搜索两个串之一(或者为这个串,或者为另一个串),使用|,如下所示:

mysql> select prod_name from products where prod_name regexp '1000|2000' order by prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+
2 rows in set (0.00 sec)

使用|从功能上类似于在SELECT语句中使用OR语句, 多个OR条件可并入单个正则表达式。

两个以上的OR条件:可以给出两个以上的OR条件。例如,’1000 | 2000 | 3000’将匹配1000或2000或3000。

9.2.3 匹配几个字符之一

可通过指定一组用[和]括起来的字符来完成选择其中之一的工作。

mysql> select prod_name from products where prod_name regexp '[123] Ton' order by prod_name;
+-------------+
| prod_name   |
+-------------+
| 1 ton anvil |
| 2 ton anvil |
+-------------+
2 rows in set (0.00 sec)

[]是另一种形式的OR语句。 事实上,正则表达式[123]Ton为[1|2|3]Ton的缩写,也可以使用后者。

mysql> select prod_name from products where prod_name regexp '[1|2|3] Ton' order by prod_name;
+-------------+
| prod_name   |
+-------------+
| 1 ton anvil |
| 2 ton anvil |
+-------------+
2 rows in set (0.00 sec)

注意:[]这种形式跟|的区别。

mysql> select prod_name from products where prod_name regexp '1|2|3 Ton' order by prod_name;
+---------------+
| prod_name     |
+---------------+
| 1 ton anvil   |
| 2 ton anvil   |
| JetPack 1000  |
| JetPack 2000  |
| TNT (1 stick) |
+---------------+
5 rows in set (0.01 sec)

|应该是匹配整个字符,而[]是括号中的字符跟后边的字符拼接之后在进行匹配。

除非把字符|括在一个集合中,否则它将应用于整个串。

字符集合也可以被否定,即,它们将匹配除指定字符外的任何东西。为否定一个字符集,在集合的开始处放置一个^即可。因此,尽管[123]匹配字符1、 2或3,但[^123]却匹配除这些字符外的任何东西。注意^号在括号内和括号外的区别。

9.2.4 匹配范围

集合可用来定义要匹配的一个或多个字符。

[0123456789]

为简化这种类型的集合,可使用-来定义一个范围。下面的式子功能上等同于上述数字列表:

[0-9]

所谓的范围匹配就是将上节所说的进行一个简单表示而已,其实本质是一个东西。

范围不限于完整的集合, [1-3]和[6-9]也是合法的范围。此外,范围不一定只是数值的, [a-z]匹配任意字母字符。

mysql> select prod_name from products where prod_name regexp '[1-5] Ton' order by prod_name;
+--------------+
| prod_name    |
+--------------+
| .5 ton anvil |
| 1 ton anvil  |
| 2 ton anvil  |
+--------------+
3 rows in set (0.00 sec)

9.2.5 匹配特殊字符

正则表达式语言由具有特定含义的特殊字符构成。我们已经看到.、[]、|和-等,还有其他一些字符。那么匹配这些字符要怎么实现呢?

mysql> select vend_name from vendors where vend_name regexp '.' order by vend_name;
+----------------+
| vend_name      |
+----------------+
| ACME           |
| Anvils R Us    |
| Furball Inc.   |
| Jet Set        |
| Jouets Et Ours |
| LT Supplies    |
+----------------+
6 rows in set (0.00 sec)

.匹配任意字符,因此每个行都被检索出来。为了匹配特殊字符,必须用\\为前导。\\-表示查找-, \\.表示查找.。

注意:这里跟其他地方不一样的,需要用两个斜杠。(其他地方大部分用一个斜杠表示转义)(如果这时只用了一个斜杠,那么效果跟没有斜杠是一样的)

mysql> select vend_name from vendors where vend_name regexp '\\.' order by vend_name;
+--------------+
| vend_name    |
+--------------+
| Furball Inc. |
+--------------+
1 row in set (0.00 sec)

这种处理就是所谓的转义( escaping),正则表达式内具有特殊意义的所有字符都必须以这种方式转义。这包括.、 |、 []以及迄今为止使用过的其他特殊字符。

\\也用来引用元字符(具有特殊含义的字符)

空白元字符

元 字 符 说 明
\\f 换页
\\n 换行
\\r 回车
\\t 制表
\\v 纵向制表

匹配\ 为了匹配反斜杠( \)字符本身,需要使用\\\。

\或\\? 多数正则表达式实现使用单个反斜杠转义特殊字符,以便能使用这些字符本身。但MySQL要求两个反斜杠 ( MySQL自己解释一个,正则表达式库解释另一个)。

9.2.6 匹配字符类

存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。为更方便工作,可以使用预定义的字符集,称为字符类

说明
[:alnum:] 任意字母和数字(同[a-zA-Z0-9])
[:alpha:] 任意字符(同[a-zA-Z])
[:blank:] 空格和制表(同[\\t])
[:cntrl:] ASCII控制字符( ASCII 0到31和127)
[:digit:] 任意数字(同[0-9])
[:graph:] 与[:print:]相同,但不包括空格
[:lower:] 任意小写字母(同[a-z])
[:print:] 任意可打印字符
[:punct:] 既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:] 包括空格在内的任意空白字符(同[\\f\\n\\r\\t\\v])
[:upper:] 任意大写字母(同[A-Z])
[:xdigit:] 任意十六进制数字(同[a-fA-F0-9])

9.2.7 匹配多个实例

目前为止使用的所有正则表达式都试图匹配单次出现。

下表9-3列出的正则表达式重复元字符可以完成连续多次匹配的问题

字符说明
* 0个或多个匹配
+ 1个或多个匹配(等于{1,})
? 0个或1个匹配(等于{0,1})
{n} 指定数目的匹配
{n,} 不少于指定数目的匹配
{n,m} 匹配数目的范围(m不超过255)
mysql> select prod_name from products where prod_name regexp '\\([0-9] sticks?\\)' order by prod_name;
+----------------+
| prod_name      |
+----------------+
| TNT (1 stick)  |
| TNT (5 sticks) |
+----------------+
2 rows in set (0.00 sec)

正则表达式\\([0-9] sticks?\\)需要解说一下。 \\(匹配(,[0-9]匹配任意数字(这个例子中为1和5), sticks?匹配stick和sticks( s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出
现), \\)匹配)。没有?,匹配stick和sticks会非常困难。

注意:?只对前边的一个字符进行重复匹配。用小括号括起来的也算是一个字符。

以下是另一个例子。

mysql> select prod_name from products where prod_name regexp '[[:digit:]]{4}' order by prod_name;
+--------------+
| prod_name    |
+--------------+
| JetPack 1000 |
| JetPack 2000 |
+--------------+
2 rows in set (0.00 sec)

注意:这里[[:digit:]]有两层括号,如果只有一层括号。则匹配不到任何值。[:digit:]其实是相当于0-9出现的,所以一定外边还要有一层括号。

mysql> select prod_name from products where prod_name regexp '[:digit:]{4}' order by prod_name;
  Empty set (0.00 sec)

9.2.8 定位符

为了匹配特定位置的文本,需要使用下表列出的定位符。

字符说明
^ 文本的开始
$ 文本的结尾
[[:<:]] 词的开始
[[:>:]] 词的结尾

如果你想找出以一个数(包括以小数点开始的数)开始的所有产品,怎么办?简单搜索[0-9\\.](或[[:digit:]\\.])不行,因为它将在文本内任意位置查找匹配。解决办法是使用^定位符

mysql> select prod_name from products where prod_name regexp '^[0-9\\.]' order by prod_name;
+--------------+
| prod_name    |
+--------------+
| .5 ton anvil |
| 1 ton anvil  |
| 2 ton anvil  |
+--------------+
3 rows in set (0.00 sec)

^的双重用途:^有两种用法。在集合中(用[和]定义),用它来否定该集合,否则,用来指串的开始处。

使REGEXP起类似LIKE的作用 本章前面说过, LIKE和REGEXP的不同在于, LIKE匹配整个串而REGEXP匹配子串。利用定位符,通过用^开始每个表达式,用$结束每个表达式,可以使REGEXP的作用与LIKE一样。

简单的正则表达式测试 可以在不使用数据库表的情况下用SELECT来测试正则表达式。REGEXP检查总是返回0 (没有匹配)或1(匹配)。可以用带文字串的REGEXP来测试表达式,并试验它们。相应的语法如下:

mysql> select 'hello' regexp '[[:digit:]]';
+------------------------------+
| 'hello' regexp '[[:digit:]]' |
+------------------------------+
|                            0 |
+------------------------------+
1 row in set (0.00 sec)

这个例子显然将返回0(因为文本hello中没有数字)。

第十章 创建计算字段

10.1 计算字段

计算字段可以计算出数据库中不存在的字段。与前面各章介绍过的列不同,计算字段并不实际存在于数据库表中。计算字段是运行时在SELECT语句内创建的。

重要的是要注意到,只有数据库知道SELECT语句中哪些列是实际的表列,哪些列是计算字段。从客户机(如应用程序)的角度来看,计算字段的数据是以与其他列的数据相同的方式返回的。

客户机与服务器的格式:可在SQL语句内完成的许多转换和格式化工作都可以直接在客户机应用程序内完成。但一般来说,在数据库服务器上完成这些操作比在客户机中完成要快得多,因为DBMS是设计来快速有效地完成这种处理的。

10.2 拼接字段

拼接( concatenate) 将值联结到一起构成单个值。

解决办法是把两个列拼接起来。在MySQL的SELECT语句中,可使用Concat()函数来拼接两个列。

MySQL的不同之处:多数DBMS使用+或||来实现拼接,MySQL则使用Concat()函数来实现。当把SQL语句转换成MySQL语句时一定要把这个区别铭记在心。

mysql> select concat(vend_name, '(', vend_country, ')') from vendors order by vend_name;
+-------------------------------------------+
| concat(vend_name, '(', vend_country, ')') |
+-------------------------------------------+
| ACME(USA)                                 |
| Anvils R Us(USA)                          |
| Furball Inc.(USA)                         |
| Jet Set(England)                          |
| Jouets Et Ours(France)                    |
| LT Supplies(USA)                          |
+-------------------------------------------+
6 rows in set (0.00 sec)

Concat()拼接串,即把多个串连接起来形成一个较长的串。Concat()需要一个或多个指定的串,各个串之间用逗号分隔。

在第8章中曾提到通过删除数据右侧多余的空格来整理数据,这可以使用MySQL的RTrim()函数来完成,如下所示:

mysql> select concat(rtrim(vend_name), '(', rtrim(vend_country), ')') from vendors order by vend_name;
+---------------------------------------------------------+
| concat(rtrim(vend_name), '(', rtrim(vend_country), ')') |
+---------------------------------------------------------+
| ACME(USA)                                               |
| Anvils R Us(USA)                                        |
| Furball Inc.(USA)                                       |
| Jet Set(England)                                        |
| Jouets Et Ours(France)                                  |
| LT Supplies(USA)                                        |
+---------------------------------------------------------+
6 rows in set (0.00 sec)

RTrim()函数去掉值右边的所有空格。通过使用RTrim(),各个列都进行了整理。

Trim函数 MySQL除了支持RTrim()(正如刚才所见,它去掉串右边的空格),还支持LTrim()(去掉串左边的空格)以及Trim()(去掉串左右两边的空格)。

使用别名

如果仅在SQL查询工具中查看一下结果,这样没有什么不好。但是,一个未

命名的列不能用于客户机应用中,因为客户机没有办法引用它。(这里所说的客户机的应用应该也是在同一条语句中的,不同的语句如果调用别名是不能找到的。客户机应用的意思就是返回到客户端的时候可以用这个别名进行调用这个值(但是还是在一条语句中的结果))

SQL支持列别名。 别名( alias) 是一个字段或值的替换名。别名用AS关键字赋予。请看下面的SELECT语句:

mysql> select concat(vend_name, '(', vend_country, ')') as vend_title from vendors order by vend_name;
+------------------------+
| vend_title             |
+------------------------+
| ACME(USA)              |
| Anvils R Us(USA)       |
| Furball Inc.(USA)      |
| Jet Set(England)       |
| Jouets Et Ours(France) |
| LT Supplies(USA)       |
+------------------------+
6 rows in set (0.00 sec)

SELECT语句本身与以前使用的相同,只不过这里的语句中计算字段之后跟了文本AS vend_title。它指示SQL创建一个包含指定计算的名为vend_title的计算字段。从输出中可以看到,结果与以前的相同,但现在列名为vend_title,任何客户机应用都可以按名引用这个列,就像它是一个实际的表列一样。

别名的其他用途:别名还有其他用途。常见的用途包括在实际的表列名包含不符合规定的字符(如空格)时重新命名它,在原来的名字含混或容易误解时扩充它,等等。

导出列:别名有时也称为导出列( derived column),不管称为什么,它们所代表的都是相同的东西。

10.3 执行算术计算

计算字段的另一常见用途是对检索出的数据进行算术计算。

mysql> select prod_id, quantity, item_price, quantity*item_price as expanded_price from orderitems where order_num = 20005;
+---------+----------+------------+----------------+
| prod_id | quantity | item_price | expanded_price |
+---------+----------+------------+----------------+
| ANV01   |       10 |       5.99 |          59.90 |
| ANV02   |        3 |       9.99 |          29.97 |
| TNT2    |        5 |      10.00 |          50.00 |
| FB      |        1 |      10.00 |          10.00 |
+---------+----------+------------+----------------+
4 rows in set (0.00 sec)

MySQL支持加减乘除基本算术操作符。此外,圆括号可用来区分优先顺序。

如何测试计算:SELECT提供了测试和试验函数与计算的一个很好的办法。虽然SELECT通常用来从表中检索数据,但可以省略FROM子句以便简单地访问和处理表达式。例如, SELECT 3*2;将返回6, SELECT Trim(‘abc’);将返回abc,而SELECT Now()利用Now()函数返回当前日期和时间。通过这些例子,可以明白如何根据需要使用SELECT进行试验。

第十一章 使用数据处理函数

11.1 函数

多数SQL语句是可移植的,在SQL实现之间有差异时,这些差异通常不那么难处理。而函数的可移植性却不强。 几乎每种主要的DBMS的实现都支持其他实现不支持的函数,而且有时差异还很大。

因此函数是一把双刃剑,一方面它有着更高的运行效率,另一方面它的可移植性又不强。

因此如果你决定使用函数,应该保证做好代码注释,以便以后你(或其他人)能确切地知道所编写SQL代码的含义。便于做到移植代码。

11.2 使用函数

大多数SQL实现支持以下类型的函数。

 用于处理文本串(如删除或填充值,转换值为大写或小写)的文本函数。
 用于在数值数据上进行算术操作(如返回绝对值,进行代数运算)的数值函数。
 用于处理日期和时间值并从这些值中提取特定成分(例如,返回两个日期之差,检查日期有效性等)的日期和时间函数。
 返回DBMS正使用的特殊信息(如返回用户登录信息,检查版本细节)的系统函数。

11.2.1 文本处理函数

下面是另一个例子,这次使用Upper()函数:

mysql> select vend_name, upper(vend_name) as vend_name_upcase from vendors order by vend_name;
+----------------+------------------+
| vend_name      | vend_name_upcase |
+----------------+------------------+
| ACME           | ACME             |
| Anvils R Us    | ANVILS R US      |
| Furball Inc.   | FURBALL INC.     |
| Jet Set        | JET SET          |
| Jouets Et Ours | JOUETS ET OURS   |
| LT Supplies    | LT SUPPLIES      |
+----------------+------------------+
6 rows in set (0.00 sec)

下表列出了某些常用的文本处理函数。

函数 说明
Left() 返回串左边的字符
Length() 返回串的长度
Locate() 找出串的一个子串
Lower() 将串转换为小写
LTrim() 去掉串左边的空格
Right() 返回串右边的字符
RTrim() 去掉串右边的空格
Soundex() 返回串的SOUNDEX值
SubString() 返回子串的字符
Upper() 将串转换为大写

SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。 SOUNDEX考虑了类似的发音字符和音节,使得能对串进行发音比较而不是字母比较。

mysql> select soundex('china');
+------------------+
| soundex('china') |
+------------------+
| C500             |
+------------------+
1 row in set (0.00 sec)
mysql> select soundex('yihuiwen')=soundex('yinhuiwen');
+------------------------------------------+
| soundex('yihuiwen')=soundex('yinhuiwen') |
+------------------------------------------+
|                                        1 |
+------------------------------------------+
1 row in set (0.00 sec)

customers表中有一个顾客Coyote Inc.,其联系名为Y.Lee。但如果这是输入错误,此联系名实际应该是Y.Lie,怎么办?显然,按正确的联系名搜索不会返回数据,如下所示:

mysql> select cust_name, cust_contact from customers where cust_contact='Y.Lie';
  Empty set (0.00 sec)

现在试一下使用Soundex()函数进行搜索,它匹配所有发音类似于Y.Lie的联系名:

mysql> select cust_name, cust_contact from customers where soundex(cust_contact)=soundex('Y.Lie');
+-------------+--------------+
| cust_name   | cust_contact |
+-------------+--------------+
| Coyote Inc. | Y Lee        |
+-------------+--------------+
1 row in set (0.00 sec)

11.2.2 日期和时间处理函数

一般,应用程序不使用用来存储日期和时间的格式,因此日期和时间函数总是被用来读取、统计和处理这些值。由于这个原因,日期和时间函数在MySQL语言中具有重要的作用。

下表列出了某些常用的日期和时间处理函数。

函数 说明
AddDate() 增加一个日期(天、周等)
AddTime() 增加一个时间(时、分等)
CurDate() 返回当前日期
CurTime() 返回当前时间
Date() 返回日期时间的日期部分
DateDiff() 计算两个日期之差
Date_Add() 高度灵活的日期运算函数
Date_Format() 返回一个格式化的日期或时间串
Day() 返回一个日期的天数部分
DayOfWeek() 对于一个日期,返回对应的星期几
Hour() 返回一个时间的小时部分
Minute() 返回一个时间的分钟部分
Month() 返回一个日期的月份部分
Now() 返回当前日期和时间
Second() 返回一个时间的秒部分
Time() 返回一个日期时间的时间部分
Year() 返回一个日期的年份部分

首先需要注意的是MySQL使用的日期格式。

日期必须为格式yyyy-mm-dd。 虽然其他的日期格式可能也行,但这是首选的日期格式,因为它排除了多义性。

应该总是使用4位数字的年份 支持2位数字的年份, MySQL处理00-69为2000-2069,处理70-99为1970-1999。虽然它们可能是打算要的年份,但使用完整的4位数字年份更可靠,因为MySQL不必做出任何假定。

mysql> select cust_id,order_num from orders where order_date='2005-09-01';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
+---------+-----------+
1 row in set (0.00 sec)

但是,使用WHERE order_date = ‘2005-09-01’可靠吗? order_date的数据类型为datetime。这种类型存储日期及时间值。样例表中的值全都具有时间值00:00:00,但实际中很可能并不总是这样。如果用当前日期和时间存储订单日期(因此你不仅知道订单日期,还知道下 订 单 当 天 的 时 间 ), 怎 么 办 ? 比 如 , 存 储 的 order_date 值 为2005-09-01 11:30:05,则WHERE order_date = ‘2005-09-01’失败。即使给出具有该日期的一行,也不会把它检索出来,因为WHERE匹配失败。

解决办法是指示MySQL仅将给出的日期与列中的日期部分进行比较,而不是将给出的日期与整个列值进行比较。为此,必须使用Date()函数。 Date(order_date)指示MySQL仅提取列的日期部分,更可靠的SELECT语句为:

mysql> select cust_id,order_num from orders where date(order_date)='2005-09-01';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
+---------+-----------+
1 row in set (0.00 sec)

如果要的是日期,请使用Date():如果你想要的仅是日期,则使用Date()是一个良好的习惯,即使你知道相应的列只包含日期也是如此。这样,如果由于某种原因表中以后有日期和时间值,你的SQL代码也不用改变。当然,也存在一个Time()函数,在你只想要时间时应该使用它。

如果你想检索出2005年9月下的所有订单,怎么办?简单的相等测试不行,因为它也要匹配月份中的天数。有几种解决办法,其中之一如下所示:

mysql> select cust_id,order_num from orders where date(order_date) between '2005-09-01' and '2005-09-30';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
|   10003 |     20006 |
|   10004 |     20007 |
+---------+-----------+
3 rows in set (0.00 sec)

但是上面的方法有一个弊端,就是你需要知道那个月的第一天跟最后一天的日期。(相当蛋疼的一件事)

so:

mysql> select cust_id,order_num from orders where year(order_date) = 2005 and month(order_date) = 9;
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
|   10003 |     20006 |
|   10004 |     20007 |
+---------+-----------+
3 rows in set (0.00 sec)

11.2.3 数值处理函数

在主要DBMS的函数中,数值函数是最一致最统一的函数。下表列出一些常用的数值处理函数。

函数 说明
Abs() 返回一个数的绝对值
Cos() 返回一个角度的余弦
Exp() 返回一个数的指数值
Mod() 返回除操作的余数
Pi() 返回圆周率
Rand() 返回一个随机数
Sin() 返回一个角度的正弦
Sqrt() 返回一个数的平方根
Tan() 返回一个角度的正切

第十二章 汇 总 数 据

12.1 聚集函数

为了得到汇总信息, MySQL给出了5个聚集函数

聚集函数( aggregate function) 运行在行组上,计算和返回单个值的函数。

函数 说明
AVG() 返回某列的平均值
COUNT() 返回某列的行数
MAX() 返回某列的最大值
MIN() 返回某列的最小值
SUM() 返回某列值之和

12.1.1 AVG()函数

AVG()通过对表中行数计数并计算特定列值之和,求得该列的平均值。 AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。(???特定行的平均值???)

mysql> select avg(prod_price) as avg_price from products;
+-----------+
| avg_price |
+-----------+
| 16.133571 |
+-----------+
1 row in set (0.00 sec)

AVG()也可以用来确定特定列或行的平均值。 下面的例子返回特定供应商所提供产品的平均价格:

mysql> select avg(prod_price) as avg_price from products where vend_id=1003;
+-----------+
| avg_price |
+-----------+
| 13.212857 |
+-----------+
1 row in set (0.00 sec)

只用于单个列 AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。

NULL值 AVG()函数忽略列值为NULL的行。

12.1.2 COUNT()函数

COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。

COUNT()函数有两种使用方式。
‰ 使用COUNT(*)对表中行的数目进行计数, 不管表列中包含的是空值( NULL)还是非空值。
‰ 使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。

mysql> select count(*) as num_cust from customers;
+----------+
| num_cust |
+----------+
|        5 |
+----------+
1 row in set (0.00 sec)

指定列名的计数:

mysql> select count(cust_email) as num_cust from customers;
+----------+
| num_cust |
+----------+
|        3 |
+----------+
1 row in set (0.00 sec)

在此例子中, cust_email的计数为3 (表示5个客户中只有3个客户有电子邮件地址)。

NULL值:如果指定列名,则指定列的值为空的行被COUNT()函数忽略,但如果COUNT()函数中用的是星号( *),则不忽略。

12.1.3 MAX()函数

MAX()返回指定列中的最大值。 MAX()要求指定列名。

mysql> select max(prod_price) as max_price from products;
+-----------+
| max_price |
+-----------+
|     55.00 |
+-----------+
1 row in set (0.00 sec)

对非数值数据使用MAX() 虽然MAX()一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。

NULL值 MAX()函数忽略列值为NULL的行。

12.1.4 MIN()函数

MIN()的功能正好与MAX()功能相反,它返回指定列的最小值。与MAX()一样, MIN()要求指定列名。

mysql> select min(prod_price) as min_price from products;
+-----------+
| min_price |
+-----------+
|      2.50 |
+-----------+
1 row in set (0.00 sec)

对非数值数据使用MIN() MIN()函数与MAX()函数类似,MySQL允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,如果数据按相应的列排序,则MIN()返回最前面的行。

NULL值 MIN()函数忽略列值为NULL的行。

12.1.5 SUM()函数

SUM()用来返回指定列值的和(总计)。

mysql> select sum(quantity) as items_ordered from orderitems where order_num=20005;
+---------------+
| items_ordered |
+---------------+
|            19 |
+---------------+
1 row in set (0.00 sec)

SUM()也可以用来合计计算值。

mysql> select sum(item_price*quantity) as total_prices from orderitems where order_num=20005;
+--------------+
| total_prices |
+--------------+
|       149.87 |
+--------------+
1 row in set (0.00 sec)

在多个列上进行计算:如上例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。

NULL值 SUM()函数忽略列值为NULL的行。

12.2 聚集不同值

以上5个聚集函数都可以如下使用:
‰ 对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为);
‰ 只包含不同的值,指定DISTINCT参数。

mysql> select avg(distinct prod_price) as avg_price from products where vend_id=1003;
+-----------+
| avg_price |
+-----------+
| 15.998000 |
+-----------+
1 row in set (0.00 sec)

注意:如果指定列名,则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*),因此不允许使用COUNT( DISTINCT),否则会产生错误。类似地, DISTINCT必须使用列名,不能用
于计算或表达式。

将DISTINCT用于MIN()和MAX() 虽然DISTINCT从技术上可用于MIN()和MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否包含不同值都是相同的。

12.3 组合聚集函数

mysql> select count(*) as num_item, min(prod_price) as price_min, max(prod_price) as price_max, avg(prod_price) as price_avg from products;
+----------+-----------+-----------+-----------+
| num_item | price_min | price_max | price_avg |
+----------+-----------+-----------+-----------+
|       14 |      2.50 |     55.00 | 16.133571 |
+----------+-----------+-----------+-----------+
1 row in set (0.00 sec)

取别名:在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做并非不合法,但使用唯一的名字会使你的SQL更易于理解和使用 (以及将来容易排除故障)。

第十三章  分 组 数 据

13.1 数据分组

分组允许把数据分为多个逻辑组,以便能对每个组进行聚集计算。

13.2 创建分组

分组是在SELECT语句的GROUP BY子句中建立的。

mysql> select vend_id, count(*) as num_prods from products group by vend_id;
+---------+-----------+
| vend_id | num_prods |
+---------+-----------+
|    1001 |         3 |
|    1002 |         2 |
|    1003 |         7 |
|    1005 |         2 |
+---------+-----------+
4 rows in set (0.00 sec)

注意:mysql中当select中的字段,在分组后表示不唯一,就会出错。如果表示唯一的话就没有问题的 。如下:

mysql> select vend_id,prod_id,count(*) from products group by vend_id;
  ERROR 1055 (42000): Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'learning.products.prod_id' 
which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

这里同一个vend_id中有好几个prod_id,所以这里就会出错(按照常理分析也是这样的,这样你没办法表示的说)。

mysql> select prod_name,count(*) from products group by prod_id;
+----------------+----------+
| prod_name      | count(*) |
+----------------+----------+
| .5 ton anvil   |        1 |
| 1 ton anvil    |        1 |
| 2 ton anvil    |        1 |
| Detonator      |        1 |
| Bird seed      |        1 |
| Carrots        |        1 |
| Fuses          |        1 |
| JetPack 1000   |        1 |
| JetPack 2000   |        1 |
| Oil can        |        1 |
| Safe           |        1 |
| Sling          |        1 |
| TNT (1 stick)  |        1 |
| TNT (5 sticks) |        1 |
+----------------+----------+
14 rows in set (0.00 sec)

上面这个例子就可以的,因为同一个prod_id只有一个prod_name。

但是从规范上来说还是不要select,group by中没有的列。

GROUP BY子句指示MySQL分组数据,然后对每个组而不是整个结果集进行聚集。

在具体使用GROUP BY子句前,需要知道一些重要的规定。

 GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。

 如果在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。

 GROUP BY子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式。不能使用别名。

 除聚集计算语句外, SELECT语句中的每个列都必须在GROUP BY子句中给出。

 如果分组列中具有NULL值,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。

 GROUP BY子句必须出现在WHERE子句之后, ORDER BY子句之前。

使用ROLLUP 使用WITH ROLLUP关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值,如下所示:

mysql> select vend_id, count(*) as num_prods from products group by vend_id with rollup;
+---------+-----------+
| vend_id | num_prods |
+---------+-----------+
|    1001 |         3 |
|    1002 |         2 |
|    1003 |         7 |
|    1005 |         2 |
|    NULL |        14 |
+---------+-----------+
5 rows in set (0.00 sec)

注意到上面的例子中比没有with rollup关键字时多了一行。

这一列就是对所有的列进行汇总的一个信息。

mysql> select vend_id,prod_id,count(*) from products group by vend_id,prod_id with rollup;;
+---------+---------+----------+
| vend_id | prod_id | count(*) |
+---------+---------+----------+
|    1001 | ANV01   |        1 |
|    1001 | ANV02   |        1 |
|    1001 | ANV03   |        1 |
|    1001 | NULL    |        3 |
|    1002 | FU1     |        1 |
|    1002 | OL1     |        1 |
|    1002 | NULL    |        2 |
|    1003 | DTNTR   |        1 |
|    1003 | FB      |        1 |
|    1003 | FC      |        1 |
|    1003 | SAFE    |        1 |
|    1003 | SLING   |        1 |
|    1003 | TNT1    |        1 |
|    1003 | TNT2    |        1 |
|    1003 | NULL    |        7 |
|    1005 | JP1000  |        1 |
|    1005 | JP2000  |        1 |
|    1005 | NULL    |        2 |
|    NULL | NULL    |       14 |
+---------+---------+----------+
19 rows in set (0.00 sec)

上面的例子比没有with rollup关键字时多了5行,分别就是对每个分组的汇总,由于vend_id分组有四个,所以对这个四个分组有四个信息行,加上对全部数据的汇总,加起来就一共是5个信息行了。

需要注意的是,使用有 WITH ROLLUP 子句的 GROUP BY 语句时,不能再使用 ORDER BY 语句对结果集进行排序,如果对返回的结果顺序不满意,需要应用程序获得结果后在程序中进行排序。

mysql> select vend_id,prod_id,count(*) from products group by vend_id,prod_id with rollup order by vend_id;
  ERROR 1221 (HY000): Incorrect usage of CUBE/ROLLUP and ORDER BY

13.3 过滤分组

在MySQL中WHERE不能过滤分组,因为WHERE过滤指定的是行而不是分组。事实上, WHERE没有分组的概念。

那么要用什么过滤分组呢?

MySQL为此目的提供了另外的子句,那就是HAVING子句。 HAVING非常类似于WHERE。事实上,目前为止所学过的所有类型的WHERE子句都可以用HAVING来替代。唯一的差别是WHERE过滤行,而HAVING过滤分组。

HAVING支持所有WHERE操作符 在第6章和第7章中,我们学习了WHERE子句的条件(包括通配符条件和带多个操作符的子句)。所学过的有关WHERE的所有这些技术和选项都适用于HAVING。它们的句法是相同的,只是关键字有差别。

mysql> select cust_id, count(*) as orders from orders group by cust_id having count(*) >= 2;
+---------+--------+
| cust_id | orders |
+---------+--------+
|   10001 |      2 |
+---------+--------+
1 row in set (0.01 sec)

HAVING和WHERE的差别:这里有另一种理解方法,WHERE在数据分组前进行过滤, HAVING在数据分组后进行过滤。这是一个重要的区别, WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。

对于where子句和having子句是可以配合使用的。首先通过where子句将符合条件的行过滤出来。然后用having将符合条件的分组过滤出来。

mysql> select vend_id, count(*) as num_prods from products where prod_price >= 10 group by vend_id having count(*) >= 2;
+---------+-----------+
| vend_id | num_prods |
+---------+-----------+
|    1003 |         4 |
|    1005 |         2 |
+---------+-----------+
2 rows in set (0.00 sec)

在上述例子中,如果没有WHERE子句,将会多检索出两行(供应商1002,销售的所有产品价格都在10以下;供应商1001,销售3个产品,但只有一个产品的价格大于等于10):

mysql> select vend_id, count(*) as num_prods from products group by vend_id having count(*) >= 2; 
+---------+-----------+
| vend_id | num_prods |
+---------+-----------+
|    1001 |         3 |
|    1002 |         2 |
|    1003 |         7 |
|    1005 |         2 |
+---------+-----------+
4 rows in set (0.00 sec)

13.4 分组和排序

ORDER BY跟GROUP BY的区别

ORDER BY GROUP BY
排序产生的输出 分组行。但输出可能不是分组的顺序
任意列都可以使用(甚至非选择的列也可以使用) 只可能使用选择列或表达式列,而且必须使用每个选择列表达式
不一定需要 如果与聚集函数一起使用列(或表达式),则必须使用

应该提供明确的ORDER BY子句,即使其效果等同于GROUP BY子句也是如此。

不要忘记ORDER BY 一般在使用GROUP BY子句时,应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。

mysql> select order_num,sum(quantity*item_price) as ordertotal from orderitems group by order_num having sum(quantity*item_price) >= 50;
+-----------+------------+
| order_num | ordertotal |
+-----------+------------+
|     20005 |     149.87 |
|     20006 |      55.00 |
|     20007 |    1000.00 |
|     20008 |     125.00 |
+-----------+------------+
4 rows in set (0.00 sec)

 

mysql> select order_num,sum(quantity*item_price) as ordertotal from orderitems group by order_num having sum(quantity*item_price) >= 50 
  order by ordertotal;
+-----------+------------+
| order_num | ordertotal |
+-----------+------------+
|     20006 |      55.00 |
|     20008 |     125.00 |
|     20005 |     149.87 |
|     20007 |    1000.00 |
+-----------+------------+
4 rows in set (0.00 sec)

13.5 SELECT子句顺序

SELECT子句及其顺序

子 句 说 明 是否必须使用
SELECT 要返回的列或表达式
FROM 从中检索数据的表 仅在从表选择数据时使用,只有在select一些表达式的时候不需要(如:select 1+1;)
WHERE 行级过滤
GROUP BY 分组说明 仅在按组计算聚集时使用(如果出现列名和聚集函数一起时,就必须要使用)
HAVING 组级过滤
ORDER BY 输出排序顺序
LIMIT 要检索的行数

第十四章 使用子查询

14.1 子查询

SQL还允许创建子查询( subquery) ,即嵌套在其他查询中的查询。

14.2 利用子查询进行过滤

mysql> select cust_id from orders where order_num in (select order_num from orderitems where prod_id='TNT2');
+---------+
| cust_id |
+---------+
|   10001 |
|   10004 |
+---------+
2 rows in set (0.00 sec)

上面的例子就是子查询了。

在SELECT语句中,子查询总是从内向外处理。在处理上面的SELECT语句时, MySQL实际上执行了两个操作。

首先,它执行下面的查询:

select order_num from orderitems where prod_id='TNT2'

此查询返回两个订单号: 20005和20007。然后,这两个值以IN操作符要求的逗号分隔的格式传递给外部查询的WHERE子句。外部查询变成:

select cust_id from orders where order_num in (20005, 20007);

格式化SQL:包含子查询的SELECT语句难以阅读和调试,特别是它们较为复杂时更是如此。可以把子查询分解为多行并且适当地进行缩进,能极大地简化子查询的使用。

mysql> select cust_name,cust_contact 
    -> from customers
    -> where cust_id in (select cust_id 
    ->                   from orders 
    ->                   where order_num in (select order_num from orderitems 
    ->                                       where prod_id='TNT2'));
+----------------+--------------+
| cust_name      | cust_contact |
+----------------+--------------+
| Coyote Inc.    | Y Lee        |
| Yosemite Place | Y Sam        |
+----------------+--------------+
2 rows in set (0.00 sec)

上面可以看到还可以嵌套三层子查询。

可见,在WHERE子句中使用子查询能够编写出功能很强并且很灵活的SQL语句。对于能嵌套的子查询的数目没有限制,不过在实际使用时由于性能的限制,不能嵌套太多的子查询。

列必须匹配:在WHERE子句中使用子查询(如这里所示),应该保证SELECT语句具有与WHERE子句中相同数目的列。通常,子查询将返回单个列并且与单个列匹配,但如果需要也可以使用多个列。

虽然子查询一般与IN操作符结合使用,但也可以用于测试等于( =)、不等于( <>)等。

子查询和性能:这里给出的代码有效并获得所需的结果。但是,使用子查询并不总是执行这种类型的数据检索的最有效的方法。

14.3 作为计算字段使用子查询

使用子查询的另一方法是创建计算字段。

mysql> select cust_name,
    ->        cust_state,
    ->        (select count(*) from orders where orders.cust_id=customers.cust_id) as orders
    ->        from customers
    ->        order by cust_name;
+----------------+------------+--------+
| cust_name      | cust_state | orders |
+----------------+------------+--------+
| Coyote Inc.    | MI         |      2 |
| E Fudd         | IL         |      1 |
| Mouse House    | OH         |      0 |
| Wascals        | IN         |      1 |
| Yosemite Place | AZ         |      1 |
+----------------+------------+--------+
5 rows in set (0.00 sec)

orders是一个计算字段,它是由圆括号中的子查询建立的。该子查询对检索出的每个客户执行一次。在此例子中,该子查询执行了5次,因为检索出了5个客户。

子查询中的WHERE子句与前面使用的WHERE子句稍有不同,因为它使用了完全限定列名(在第4章中首次提到)。因为他要将orders表中cust_id跟customers表中cust_id进行匹配。

相关子查询( correlated subquery):涉及外部查询的子查询。

任何时候只要列名可能有多义性,就必须使用这种语法(表名和列名由一个句点分隔)。

虽然子查询在构造这种SELECT语句时极有用,但必须注意限制有歧义性的列名

不止一种解决方案:正如本章前面所述,虽然这里给出的样例代码运行良好,但它并不是解决这种数据检索的最有效的方法。在后面的章节中我们还要遇到这个例子。

逐渐增加子查询来建立查询:在写子查询的时候,应该逐步增加子查询,这样可以对每一个子查询进行检验,不容易出错。

第十五章  联 结 表

15.1 联结

SQL最强大的功能之一就是能在数据检索查询的执行中联结( join)表。联结是利用SQL的SELECT能执行的最重要的操作,

15.1.1 关系表(设计MySQL时的一个原则)

相同数据出现多次决不是一件好事,此因素是关系数据库设计的基础。关系表的设计就是要保证把信息分解成多个表,一类数据一个表。各表通过某些常用的值(即关系设计中的关系( elational) )互相关联。

建立两个表,一个存储供应商信息,另一个存储产品信息。 vendors表包含所有供应商信息,每个供应商占一行,每个供应商具有唯一的标识。此标识称为主键( primary key) (在第1章中首次
提到),可以是供应商ID或任何其他唯一值。
products表只存储产品信息,它除了存储供应商ID( vendors表的主键)外不存储其他供应商信息。vendors表的主键又叫作products的外键,它将vendors表与products表关联,利用供应商ID能从vendors表中找出相应供应商的详细信息。

外键( foreign key) 外键为某个表中的一列,它包含另一个表的主键值,定义了两个表之间的关系。
这样做的好处如下:
 供应商信息不重复,从而不浪费时间和空间;
 如果供应商信息变动,可以只更新vendors表中的单个记录,相关表中的数据不用改动;
 由于数据无重复,显然数据是一致的,这使得处理数据更简单。

总之,关系数据可以有效地存储和方便地处理。因此,关系数据库的可伸缩性远比非关系数据库要好。

可伸缩性( scale):能够适应不断增加的工作量而不失败。设计良好的数据库或应用程序称之为可伸缩性好( scale well) 。

15.1.2 为什么要使用联结

分解数据为多个表能更有效地存储,更方便地处理,并且具有更大的可伸缩性。但是如果数据存储在多个表中,怎样用单条SELECT语句检索出数据?

答案是使用联结。简单地说,联结是一种机制,用来在一条SELECT语句中关联表,因此称之为联结。使用特殊的语法,可以联结多个表返回一组输出,联结在运行时关联表中正确的行。

维护引用完整性:

重要的是,要理解联结不是物理实体。换句话说,它在实际的数据库表中不存在。联结由MySQL根据需要建立,它存在于查询的执行当中。

那么如果出现一个表的外键的列中的值并没有与之对应的主键的值,那么这个时候就会出现问题。

为防止这种情况发生,可指示MySQL只允许在products表的供应商ID列中出现合法值(即出现在vendors表中的供应商)。这就是维护引用完整性,它是通过在表的定义中指定主键和外键来实现的。

15.2 创建联结

mysql> select vend_name, prod_name, prod_price         
    ->        from vendors, products 
    ->        where vendors.vend_id=products.vend_id
    ->        order by vend_name,prod_name;
+-------------+----------------+------------+
| vend_name   | prod_name      | prod_price |
+-------------+----------------+------------+
| ACME        | Bird seed      |      10.00 |
| ACME        | Carrots        |       2.50 |
| ACME        | Detonator      |      13.00 |
| ACME        | Safe           |      50.00 |
| ACME        | Sling          |       4.49 |
| ACME        | TNT (1 stick)  |       2.50 |
| ACME        | TNT (5 sticks) |      10.00 |
| Anvils R Us | .5 ton anvil   |       5.99 |
| Anvils R Us | 1 ton anvil    |       9.99 |
| Anvils R Us | 2 ton anvil    |      14.99 |
| Jet Set     | JetPack 1000   |      35.00 |
| Jet Set     | JetPack 2000   |      55.00 |
| LT Supplies | Fuses          |       3.42 |
| LT Supplies | Oil can        |       8.99 |
+-------------+----------------+------------+
14 rows in set (0.00 sec)

这条语句的FROM子句列出了两个表,分别是vendors和products。它们就是这条SELECT语句联结的两个表的名字。这两个表用WHERE子句正确联结, WHERE子句指示MySQL匹配vendors表中的vend_id和products表中的vend_id。

注意: 这里需要这种完全限定列名,因为如果只给出vend_id,则MySQL不知道指的是哪一个(它们有两个,每个表中一个)。

完全限定列名:在引用的列可能出现二义性时,必须使用完全限定列名(用一个点分隔的表名和列名)。如果引用一个没有用表名限制的具有二义性的列名, MySQL将返回错误。

15.2.1 WHERE子句的重要性

在联结两个表时,你实际上做的是将第一个表中的每一行与第二个表中的每一行配对。 WHERE子句作为过滤条件,它只包含那些匹配给定条件(这里是联结条件)的行。 没有WHERE子句,第一个表中的每个行将与第二个表中的每个行配对,而不管它们逻辑上是否可以配在一起。

笛卡儿积( cartesian product):由没有联结条件的表关系返回的结果为笛卡儿积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数。

 mysql> select vend_name,prod_name,prod_price
    ->        from vendors, products
    ->        order by vend_name,prod_name;
+----------------+----------------+------------+
| vend_name      | prod_name      | prod_price |
+----------------+----------------+------------+
| ACME           | .5 ton anvil   |       5.99 |
| ACME           | 1 ton anvil    |       9.99 |
| ACME           | 2 ton anvil    |      14.99 |
| ACME           | Bird seed      |      10.00 |
| ACME           | Carrots        |       2.50 |
| ACME           | Detonator      |      13.00 |
| ACME           | Fuses          |       3.42 |
| ACME           | JetPack 1000   |      35.00 |
| ACME           | JetPack 2000   |      55.00 |
.......

不要忘了WHERE子句:应该保证所有联结都有WHERE子句,否则MySQL将返回比想要的数据多得多的数据。同理,应该保证WHERE子句的正确性。不正确的过滤条件将导致MySQL返回不正确的数据。

叉联结:有时我们会听到返回称为叉联结( cross join)的笛卡儿积的联结类型。

15.2.2 内部联结

目前为止所用的联结称为等值联结( equijoin),它基于两个表之间的相等测试。这种联结也称为内部联结。其实,对于这种联结可以使用稍微不同的语法来明确指定联结的类型。

mysql> SELECT vend_name,prod_name,prod_price 
    ->        FROM vendors INNER JOIN products 
    ->        ON vendors.vend_id=products.vend_id
    ->        ORDER BY vend_name,prod_name;
+-------------+----------------+------------+
| vend_name   | prod_name      | prod_price |
+-------------+----------------+------------+
| ACME        | Bird seed      |      10.00 |
| ACME        | Carrots        |       2.50 |
| ACME        | Detonator      |      13.00 |
| ACME        | Safe           |      50.00 |
| ACME        | Sling          |       4.49 |
| ACME        | TNT (1 stick)  |       2.50 |
| ACME        | TNT (5 sticks) |      10.00 |
| Anvils R Us | .5 ton anvil   |       5.99 |
| Anvils R Us | 1 ton anvil    |       9.99 |
| Anvils R Us | 2 ton anvil    |      14.99 |
| Jet Set     | JetPack 1000   |      35.00 |
| Jet Set     | JetPack 2000   |      55.00 |
| LT Supplies | Fuses          |       3.42 |
| LT Supplies | Oil can        |       8.99 |
+-------------+----------------+------------+
14 rows in set (0.00 sec)

这里,两个表之间的关系是FROM子句的组成部分,以INNERJOIN指定。在使用这种语法时,联结条件用特定的ON子句而不是WHERE子句给出。传递给ON的实际条件与传递给WHERE的相同。

使用哪种语法 ANSI SQL规范首选INNER JOIN语法。此外,尽管使用WHERE子句定义联结的确比较简单,但是使用明确的联结语法能够确保不会忘记联结条件,有时候这样做也能影响性能。

15.2.3 联结多个表

SQL对一条SELECT语句中可以联结的表的数目没有限制。创建联结的基本规则也相同。 首先列出所有表,然后定义表之间的关系。

mysql> SELECT prod_name,vend_name,prod_price,quantity
    ->        FROM orderitems, products, vendors
    ->        WHERE products.vend_id=vendors.vend_id
    ->          AND products.prod_id=orderitems.prod_id
    ->          AND order_num = 20005;
+----------------+-------------+------------+----------+
| prod_name      | vend_name   | prod_price | quantity |
+----------------+-------------+------------+----------+
| .5 ton anvil   | Anvils R Us |       5.99 |       10 |
| 1 ton anvil    | Anvils R Us |       9.99 |        3 |
| TNT (5 sticks) | ACME        |      10.00 |        5 |
| Bird seed      | ACME        |      10.00 |        1 |
+----------------+-------------+------------+----------+
4 rows in set (0.00 sec)

性能考虑:MySQL在运行时关联指定的每个表以处理联结。这种处理可能是非常耗费资源的,因此应该仔细,不要联结不必要的表。联结的表越多,性能下降越厉害。

多做实验:正如所见,为执行任一给定的SQL操作,一般存在不止一种方法。很少有绝对正确或绝对错误的方法。性能可能会受操作类型、表中数据量、是否存在索引或键以及其他一些条件的影响。因此,有必要对不同的选择机制进行实验,以找出最适合具体情况的方法。

第十六章 创建高级联结

16.1 使用表别名

别名除了用于列名和计算字段外, SQL还允许给表名起别名。这样做有两个主要理由:
 缩短SQL语句;
 允许在单条SELECT语句中多次使用相同的表。(自联结的时候使用)

mysql> SELECT cust_name,cust_contact
    ->        FROM customers AS c, orders AS o, orderitems AS oi
    ->        WHERE c.cust_id=o.cust_id
    ->          AND oi.order_num=o.order_num
    ->          AND prod_id='TNT2';
+----------------+--------------+
| cust_name      | cust_contact |
+----------------+--------------+
| Coyote Inc.    | Y Lee        |
| Yosemite Place | Y Sam        |
+----------------+--------------+
2 rows in set (0.00 sec)

应该注意,表别名只在查询执行中使用。与列别名不一样,表别名不返回到客户机。

16.2 使用不同类型的联结

16.2.1 自联结

使用表别名的主要原因之一是能在单条SELECT语句中不止一次引用相同的表。

mysql> SELECT p1.prod_id, p1.prod_name
    ->        FROM products AS p1, products AS p2
    ->        WHERE p1.vend_id=p2.vend_id
    ->          AND p2.prod_id='DTNTR';
+---------+----------------+
| prod_id | prod_name      |
+---------+----------------+
| DTNTR   | Detonator      |
| FB      | Bird seed      |
| FC      | Carrots        |
| SAFE    | Safe           |
| SLING   | Sling          |
| TNT1    | TNT (1 stick)  |
| TNT2    | TNT (5 sticks) |
+---------+----------------+
7 rows in set (0.00 sec)

为解决products表出现了两次的二义性的问题,使用了表别名。 products的第一次出现为别名p1,第二次出现为别名p2。现在可以将这些别名用作表名。

用自联结而不用子查询:自联结通常作为外部语句用来替代从相同表中检索数据时使用的子查询语句。虽然最终的结果是相同的,但有时候处理联结远比处理子查询快得多。应该试一下两种方法,以确定哪一种的性能更好。

16.2.2 自然联结

无论何时对表进行联结,应该至少有一个列出现在不止一个表中(被联结的列)。标准的联结(前一章中介绍的内部联结)返回所有数据,甚至相同的列多次出现。 自然联结排除多次出现,使每个列只返回一次。

我的理解就是,返回的数据中没有完全相同的列出现,就是联结的那两个列只出现一次。

下面是怎么得到自然联结:

R表                S表
A  B  C                     D  B  E
1  a  3                      2  c  7
2  b  6                      3  d  5
3  c  7                      1  a  3       自然连接怎么连接?

a) 自然连接是第一步R×S结果是:
A   B     C      D     B       E
1   a     3      2     c       7
1   a     3      3     d       5
1   a     3      1     a       3
2   b     6      2     c       7
2   b     6      3     d       5
2   b     6      1     a       3
3   c     7      2     c       7
3   c     7      3     d       5 
3   c     7      1     a       3
就是用R表中的每一项乘以S表中的每一项。
b) 选择R.B=S.B的记录:

R.A    R.B     R.C       S.D     S.B    S.E
1       a       3         1       a       3 
3       c       7         2       c       7

c) 然后去掉相同且值也相同的B属性,最后R∞S的值为:
   A     B      C      D       E
   1     a      3      1        3
   3     c      7      2        7

注:系统不会帮你完成自然联结的工作的,由你自己完成它。自然联结是这样一种联结,其中你只能选择那些唯一的列。

这一般是通过对表使用通配符( SELECT *),对所有其他表的列使用明确的子集来完成的。(也就是说不能出现两次*号,在select子句中)

事实上,迄今为止我们建立的每个内部联结都是自然联结,很可能我们永远都不会用到不是自然联结的内部联结。

16.2.3 外部联结

许多联结将一个表中的行与另一个表中的行相关联。但有时候会需要包含没有关联行的那些行。

例如: 列出所有产品以及订购数量,包括没有人订购的产品

联结包含了那些在相关表中没有关联行的行。这种类型的联结称为外部联结。

mysql> SELECT customers.cust_id, orders.order_num
    ->        FROM customers LEFT OUTER JOIN orders
    ->        ON customers.cust_id=orders.cust_id;
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
|   10001 |     20009 |
|   10002 |      NULL |
|   10003 |     20006 |
|   10004 |     20007 |
|   10005 |     20008 |
+---------+-----------+
6 rows in set (0.00 sec)

与内部联结关联两个表中的行不同的是,外部联结还包括没有关联行的行。在使用OUTER JOIN语法时,必须使用RIGHT或LEFT关键字指定包括其所有行的表( RIGHT指出的是OUTER JOIN右边的表,而LEFT指出的是OUTER JOIN左边的表)。

没有*=操作符 MySQL不支持简化字符*=和=*的使用,这两种操作符在其他DBMS中是很流行的。

外部联结的类型 存在两种基本的外部联结形式:左外部联结和右外部联结。它们之间的唯一差别是所关联的表的顺序不同。换句话说,左外部联结可通过颠倒FROM或WHERE子句中表的顺序转换为右外部联结。因此,两种类型的外部联结可互换使用,而究竟使用哪一种纯粹是根据方便而定。

16.3 使用带聚集函数的联结

聚集函数用来汇总数据, 这些函数也可以与联结一起使用。

mysql> SELECT customers.cust_name,
    ->        customers.cust_id,
    ->        count(orders.order_num) AS num_ord
    ->        FROM customers INNER JOIN orders
    ->        ON customers.cust_id=orders.cust_id
    ->        GROUP BY customers.cust_id;
+----------------+---------+---------+
| cust_name      | cust_id | num_ord |
+----------------+---------+---------+
| Coyote Inc.    |   10001 |       2 |
| Wascals        |   10003 |       1 |
| Yosemite Place |   10004 |       1 |
| E Fudd         |   10005 |       1 |
+----------------+---------+---------+
4 rows in set (0.00 sec)
mysql> SELECT customers.cust_name,
    ->        customers.cust_id,
    ->        COUNT(orders.order_num) AS num_ord
    ->        FROM customers LEFT OUTER JOIN orders
    ->        ON customers.cust_id=orders.cust_id
    ->        GROUP BY customers.cust_id;
+----------------+---------+---------+
| cust_name      | cust_id | num_ord |
+----------------+---------+---------+
| Coyote Inc.    |   10001 |       2 |
| Mouse House    |   10002 |       0 |
| Wascals        |   10003 |       1 |
| Yosemite Place |   10004 |       1 |
| E Fudd         |   10005 |       1 |
+----------------+---------+---------+
5 rows in set (0.00 sec)

16.4 使用联结和联结条件

在总结关于联结的这两章前,有必要汇总一下关于联结及其使用的某些要点。

 注意所使用的联结类型。一般我们使用内部联结,但使用外部联结也是有效的。
 保证使用正确的联结条件,否则将返回不正确的数据。
 应该总是提供联结条件,否则会得出笛卡儿积。
 在一个联结中可以包含多个表,甚至对于每个联结可以采用不同的联结类型。虽然这样做是合法的,一般也很有用,但应该在一起测试它们前,分别测试每个联结。这将使故障排除更为简单。

第十七章  组 合 查 询

17.1 组合查询

多数SQL查询都只包含从一个或多个表中返回数据的单条SELECT语句。 MySQL也允许执行多个查询(多条SELECT语句),并将结果作为单个查询结果集返回。这些组合查询通常称为并( union) 或复合查询( compound query)。

有两种基本情况,其中需要使用组合查询:
 在单个查询中从不同的表返回类似结构的数据;
 对单个表执行多个查询,按单个查询返回数据。

组合查询和多个WHERE条件:多数情况下,组合相同表的两个查询完成的工作与具有多个WHERE子句条件的单条查询完成的工作相同。换句话说,任何具有多个WHERE子句的SELECT语句都可以作为一个组合查询给出,在以下段落中可以看到这一点。这两种技术在不同的查询中性能也不同。因此,应该试一下这两种技术,以确定对特定的查询哪一种性能更好

17.2 创建组合查询

可用UNION操作符来组合数条SQL查询。利用UNION,可给出多条SELECT语句,将它们的结果组合成单个结果集。

17.2.1 使用UNION

UNION的使用很简单。所需做的只是给出每条SELECT语句,在各条语句之间放上关键字UNION。

mysql> SELECT vend_id, prod_id, prod_price
    ->        FROM products 
    ->        WHERE prod_price<=5
    -> UNION  
    -> SELECT vend_id, prod_id, prod_price
    ->        FROM products
    ->        WHERE vend_id IN (1001, 1002);
+---------+---------+------------+
| vend_id | prod_id | prod_price |
+---------+---------+------------+
|    1003 | FC      |       2.50 |
|    1002 | FU1     |       3.42 |
|    1003 | SLING   |       4.49 |
|    1003 | TNT1    |       2.50 |
|    1001 | ANV01   |       5.99 |
|    1001 | ANV02   |       9.99 |
|    1001 | ANV03   |      14.99 |
|    1002 | OL1     |       8.99 |
+---------+---------+------------+
8 rows in set (0.00 sec)

UNION指示MySQL执行两条SELECT语句,并把输出组合成单个查询结果集。

作为参考,这里给出使用多条WHERE子句而不是使用UNION的相同查询:

mysql> SELECT vend_id, prod_id, prod_price                                                                     
    ->        FROM products
    ->        WHERE prod_price<=5 OR vend_id IN (1001, 1002);
+---------+---------+------------+
| vend_id | prod_id | prod_price |
+---------+---------+------------+
|    1001 | ANV01   |       5.99 |
|    1001 | ANV02   |       9.99 |
|    1001 | ANV03   |      14.99 |
|    1003 | FC      |       2.50 |
|    1002 | FU1     |       3.42 |
|    1002 | OL1     |       8.99 |
|    1003 | SLING   |       4.49 |
|    1003 | TNT1    |       2.50 |
+---------+---------+------------+
8 rows in set (0.00 sec)

在这个简单的例子中,使用UNION可能比使用WHERE子句更为复杂。但对于更复杂的过滤条件,或者从多个表(而不是单个表)中检索数据的情形,使用UNION可能会使处理更简单。

17.2.2 UNION规则

进行并时有几条规则需要注意。

 UNION必须由两条或两条以上的SELECT语句组成,语句之间用关键字UNION分隔(因此,如果组合4条SELECT语句,将要使用3个UNION关键字)。
 UNION中的每个查询必须包含相同的列、表达式或聚集函数(不过各个列不需要以相同的次序列出)。
 列数据类型必须兼容:类型不必完全相同,但必须是DBMS可以隐含地转换的类型(例如,不同的数值类型或不同的日期类型)。

17.2.3 包含或取消重复的行

UNION从查询结果集中自动去除了重复的行(换句话说,它的行为与单条SELECT语句中使用多个WHERE子句条件一样)。

这是UNION的默认行为,但是如果需要,可以改变它。事实上,如果想返回所有匹配行,可使用UNION ALL而不是UNION。

 mysql> SELECT vend_id, prod_id, prod_price                                                                     
    ->        FROM products
    ->        WHERE prod_price<=5
    -> UNION ALL
    -> SELECT vend_id, prod_price,prod_id
    ->        FROM products
    ->        WHERE vend_id IN (1001, 1002);
+---------+---------+------------+
| vend_id | prod_id | prod_price |
+---------+---------+------------+
|    1003 | FC      | 2.50       |
|    1002 | FU1     | 3.42       |
|    1003 | SLING   | 4.49       |
|    1003 | TNT1    | 2.50       |
|    1001 | 5.99    | ANV01      |
|    1001 | 9.99    | ANV02      |
|    1001 | 14.99   | ANV03      |
|    1002 | 3.42    | FU1        |
|    1002 | 8.99    | OL1        |
+---------+---------+------------+
9 rows in set (0.00 sec)

UNION与WHERE:本章开始时说过, UNION几乎总是完成与多个WHERE条件相同的工作。 UNION ALL为UNION的一种形式,它完成WHERE子句完成不了的工作。如果确实需要每个条件的匹配行全部出现(包括重复行),则必须使用UNION ALL而不是WHERE。

17.2.4 对组合查询结果排序

SELECT语句的输出用ORDER BY子句排序。在用UNION组合查询时,只能使用一条ORDER BY子句,它必须出现在最后一条SELECT语句之后。对于结果集,不存在用一种方式排序一部分,而又用另一种方式排序另一部分的情况,因此不允许使用多条ORDER BY子句。

mysql> SELECT vend_id, prod_id, prod_price
    ->        FROM products
    ->        WHERE prod_price<=5
    -> UNION
    -> SELECT vend_id, prod_price,prod_id
    ->        FROM products
    ->        WHERE vend_id IN (1001, 1002)
    -> ORDER BY vend_id, prod_price;
+---------+---------+------------+
| vend_id | prod_id | prod_price |
+---------+---------+------------+
|    1001 | 5.99    | ANV01      |
|    1001 | 9.99    | ANV02      |
|    1001 | 14.99   | ANV03      |
|    1002 | FU1     | 3.42       |
|    1002 | 3.42    | FU1        |
|    1002 | 8.99    | OL1        |
|    1003 | FC      | 2.50       |
|    1003 | TNT1    | 2.50       |
|    1003 | SLING   | 4.49       |
+---------+---------+------------+
9 rows in set (0.00 sec)

虽然ORDER BY子句似乎只是最后一条SELECT语句的组成部分,但实际上MySQL将用它来排序所有SELECT语句返回的所有结果。

组合不同的表:为使表述比较简单,本章例子中的组合查询使用的均是相同的表。但是其中使用UNION的组合查询可以应用不同的表。

第十八章  全文本搜索

18.1 理解全文本搜索

并非所有引擎都支持全文本搜索:正如第21章所述, MySQL支持几种基本的数据库引擎。并非所有的引擎都支持本书所描述的全文本搜索。两个最常使用的引擎为MyISAM和InnoDB,前者支持全文本搜索,而后者不支持。这就是为什么虽然本书中 创 建 的 多 数 样 例 表 使 用 InnoDB , 而 有 一 个 样 例 表( productnotes表)却使用MyISAM的原因。如果你的应用中需要全文本搜索功能,应该记住这一点。

之前的LIKE和正则表达式非常有用,但存在几个重要的限制。

 性能——通配符和正则表达式匹配通常要求MySQL尝试匹配表中所有行(而且这些搜索极少使用表索引)。因此,由于被搜索行数不断增加,这些搜索可能非常耗时。
 明确控制——使用通配符和正则表达式匹配,很难(而且并不总是能)明确地控制匹配什么和不匹配什么。例如,指定一个词必须匹配,一个词必须不匹配,而一个词仅在第一个词确实匹配的
情况下才可以匹配或者才可以不匹配。
 智能化的结果——虽然基于通配符和正则表达式的搜索提供了非常灵活的搜索,但它们都不能提供一种智能化的选择结果的方法。例如,一个特殊词的搜索将会返回包含该词的所有行,而不区分
包含单个匹配的行和包含多个匹配的行(按照可能是更好的匹配来排列它们)。类似,一个特殊词的搜索将不会找出不包含该词但包含其他相关词的行。

所有这些限制以及更多的限制都可以用全文本搜索来解决。在使用全文本搜索时, MySQL不需要分别查看每个行,不需要分别分析和处理每个词。 MySQL创建指定列中各词的一个索引,搜索可以针对这些词进行。

18.2 使用全文本搜索

为了进行全文本搜索,必须索引被搜索的列,而且要随着数据的改变不断地重新索引。在对表列进行适当设计后, MySQL会自动进行所有的索引和重新索引。

在索引之后, SELECT可与Match()和Against()一起使用以实际执行搜索。

18.2.1 启用全文本搜索支持

一般在创建表时启用全文本搜索。

下面的CREATE语句演示了FULLTEXT子句的使用:

CREATE TABLE productnotes
(
  note_id    int           NOT NULL AUTO_INCREMENT,
  prod_id    char(10)      NOT NULL,
  note_date datetime       NOT NULL,
  note_text  text          NULL ,
  PRIMARY KEY(note_id),
  FULLTEXT(note_text)
) ENGINE=MyISAM;

为了进行全文本搜索,MySQL根据子句FULLTEXT(note_text)的指示对它进行索引。这里的FULLTEXT索引单个列,如果需要也可以指定多个列。

在定义之后, MySQL自动维护该索引。在增加、更新或删除行时,索引随之自动更新。

可以在创建表时指定FULLTEXT,或者在稍后指定(在这种情况下所有已有数据必须立即索引)。

不要在导入数据时使用FULLTEXT:更新索引要花时间,虽然不是很多,但毕竟要花时间。如果正在导入数据到一个新表,此时不应该启用FULLTEXT索引。应该首先导入所有数据,然后再修改表, 定义FULLTEXT。 这样有助于更快地导入数据(而且使索引数据的总时间小于在导入每行时分别进行索引所需的总时间)。

18.2.2 进行全文本搜索

在索引之后,使用两个函数Match()和Against()执行全文本搜索,其中Match()指定被搜索的列, Against()指定要使用的搜索表达式。

mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('rabbit');
+----------------------------------------------------------------------------------------------------------------------+
| note_text                                                                                                            |
+----------------------------------------------------------------------------------------------------------------------+
| Customer complaint: rabbit has been able to detect trap, food apparently less effective now.                         |
| Quantity varies, sold by the sack load. All guaranteed to be bright and orange, and suitable for use as rabbit bait. |
+----------------------------------------------------------------------------------------------------------------------+
2 rows in set (0.00 sec)

由于WHERE子句,一个全文本搜索被执行。 Match(note_text)指示MySQL针对指定的列进行搜索, Against(‘rabbit’)指定词rabbit作为搜索文本。由于有两行包含词rabbit,这两个行被返回。

使 用 完 整 的 Match() 说 明 传 递 给 Match() 的 值 必 须 与FULLTEXT()定义中的相同。如果指定多个列,则必须列出它们(而且次序正确)。

搜索不区分大小写 除非使用BINARY方式 (本章中没有介绍),否则全文本搜索不区分大小写。

使用全文本搜索返回以文本匹配的良好程度排序的数据。两个行都包含词rabbit,但包含词rabbit作为第3个词的行的等级比作为第20个词的行高。这很重要。全文本搜索的一个重要部分就是对结果排序。具有较高等级的行先返回(因为这些行很可能是你真正想要的行)。

 mysql> SELECT note_text, Match(note_text) Against('rabbit') AS rank from productnotes;
+-----------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------+
| note_text                                                                                                                                                 | rank               |
+-----------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------+
| Customer complaint: Sticks not individually wrapped, too easy to mistakenly detonate all at once. Recommend individual wrapping.                          |                  0 |
| Can shipped full, refills not available. Need to order new can if refill needed.                                                                          |                  0 |
| Safe is combination locked, combination not provided with safe. This is rarely a problem as safes are typically blown up or dropped by customers.         |                  0 |
| Quantity varies, sold by the sack load. All guaranteed to be bright and orange, and suitable for use as rabbit bait.                                      | 1.5905543565750122 |
| Included fuses are short and have been known to detonate too quickly for some customers. Longer fuses are available (item FU1) and should be recommended. |                  0 |
| Matches not included, recommend purchase of matches or detonator (item DTNTR).                                                                            |                  0 |
| Please note that no returns will be accepted if safe opened using explosives.                                                                             |                  0 |
| Multiple customer returns, anvils failing to drop fast enough or falling backwards on purchaser. Recommend that customer considers using heavier anvils.  |                  0 |
| Item is extremely heavy. Designed for dropping, not recommended for use with slings, ropes, pulleys, or tightropes.                                       |                  0 |
| Customer complaint: rabbit has been able to detect trap, food apparently less effective now.                                                              | 1.6408053636550903 |
| Shipped unassembled, requires common tools (including oversized hammer).                                                                                  |                  0 |
| Customer complaint: Circular hole in safe floor can apparently be easily cut with handsaw.                                                                |                  0 |
| Customer complaint: Not heavy enough to generate flying stars around head of victim. If being purchased for dropping, recommend ANV02 or ANV03 instead.   |                  0 |
| Call from individual trapped in safe plummeting to the ground, suggests an escape hatch be added. Comment forwarded to vendor.                            |                  0 |
+-----------------------------------------------------------------------------------------------------------------------------------------------------------+--------------------+
14 rows in set (0.01 sec)

等级由MySQL根据行中词的数目、唯一词的数目、整个索引中词的总数以及包含该词的行的数目计算出来。正如所见,不包含词rabbit的行等级为0(因此不被前一例子中的WHERE子句选择)。确实包含词rabbit的两个行每行都有一个等级值,文本中词靠前的行的等级值比词靠后的行的等级值高。

这个例子有助于说明全文本搜索如何排除行(排除那些等级为0的行),如何排序结果(按等级以降序排序)。

排序多个搜索项:如果指定多个搜索项,则包含多数匹配词的那些行将具有比包含较少词(或仅有一个匹配)的那些行高的等级值。

正如所见,全文本搜索提供了简单LIKE搜索不能提供的功能。而且,由于数据是索引的,全文本搜索还相当快。

18.2.3 使用查询扩展

询扩展用来设法放宽所返回的全文本搜索结果的范围。

在使用查询扩展时, MySQL对数据和索引进行两遍扫描来完成搜索:

 首先,进行一个基本的全文本搜索,找出与搜索条件匹配的所有行;
 其次, MySQL检查这些匹配行并选择所有有用的词(我们将会简要地解释MySQL如何断定什么有用,什么无用)。
 再其次, MySQL再次进行全文本搜索,这次不仅使用原来的条件,而且还使用所有有用的词。

利用查询扩展,能找出可能相关的结果,即使它们并不精确包含所查找的词。

首先进行一个简单的全文本搜索,没有查询扩展:

mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('anvils');
+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| note_text                                                                                                                                                |
+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| Multiple customer returns, anvils failing to drop fast enough or falling backwards on purchaser. Recommend that customer considers using heavier anvils. |
+----------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

下面是相同的搜索,这次使用查询扩展:

mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('anvils' WITH QUERY EXPANSION);
+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| note_text                                                                                                                                                |
+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| Multiple customer returns, anvils failing to drop fast enough or falling backwards on purchaser. Recommend that customer considers using heavier anvils. |
| Customer complaint: Sticks not individually wrapped, too easy to mistakenly detonate all at once. Recommend individual wrapping.                         |
| Customer complaint: Not heavy enough to generate flying stars around head of victim. If being purchased for dropping, recommend ANV02 or ANV03 instead.  |
| Please note that no returns will be accepted if safe opened using explosives.                                                                            |
| Customer complaint: rabbit has been able to detect trap, food apparently less effective now.                                                             |
| Customer complaint: Circular hole in safe floor can apparently be easily cut with handsaw.                                                               |
| Matches not included, recommend purchase of matches or detonator (item DTNTR).                                                                           |
+----------------------------------------------------------------------------------------------------------------------------------------------------------+
7 rows in set (0.00 sec)

第一行包含词anvils,因此等级最高。第二行与anvils无关,但因为它包含第一行中的两个词( customer和recommend),所以也被检索出来。第3行也包含这两个相同的词,但它们在文本中的位置更靠后且分开得更远,因此也包含这一行,但等级为第三。第三行确实也没有涉及anvils(按它们的产品名)。

正如所见,查询扩展极大地增加了返回的行数,但这样做也增加了你实际上并不想要的行的数目。

行越多越好 表中的行越多(这些行中的文本就越多),使用查询扩展返回的结果越好。

18.2.4 布尔文本搜索

MySQL支持全文本搜索的另外一种形式,称为布尔方式。

以布尔方式,可以提供关于如下内容的细节:

 要匹配的词;
 要排斥的词(如果某行包含这个词,则不返回该行,即使它包含其他指定的词也是如此);
 排列提示(指定某些词比其他词更重要,更重要的词等级更高);
 表达式分组;
 另外一些内容。

即使没有FULLTEXT索引也可以使用:布尔方式不同于迄今为止 使 用 的 全 文 本 搜 索 语 法 的 地 方 在 于 , 即 使 没 有 定 义FULLTEXT索引,也可以使用它。但这是一种非常缓慢的操作(其性能将随着数据量的增加而降低)

为了匹配包含heavy但不包含任意以rope开始的词的行, 可使用以下查询:

mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('heavy -rope*' IN BOOLEAN MODE);
+---------------------------------------------------------------------------------------------------------------------------------------------------------+
| note_text                                                                                                                                               |
+---------------------------------------------------------------------------------------------------------------------------------------------------------+
| Customer complaint: Not heavy enough to generate flying stars around head of victim. If being purchased for dropping, recommend ANV02 or ANV03 instead. |
+---------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

如果不使用IN BOOLEAN MODE则:

mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('heavy -rope*');
+---------------------------------------------------------------------------------------------------------------------------------------------------------+
| note_text                                                                                                                                               |
+---------------------------------------------------------------------------------------------------------------------------------------------------------+
| Item is extremely heavy. Designed for dropping, not recommended for use with slings, ropes, pulleys, or tightropes.                                     |
| Customer complaint: Not heavy enough to generate flying stars around head of victim. If being purchased for dropping, recommend ANV02 or ANV03 instead. |
+---------------------------------------------------------------------------------------------------------------------------------------------------------+
2 rows in set (0.00 sec)

上例中可以看到了两个全文本搜索布尔操作符-和*, -排除一个词,而*是截断操作符(可想象为用于词尾的一个通配符)。

下表列出支持的所有布尔操作符。

布尔操作符 说明
+ 包含,词必须存在
排除,词必须不出现
> 包含,而且增加等级值
< 包含,且减少等级值
() 把词组成子表达式(允许这些子表达式作为一个组被包含、排除、排列等)
~ 取消一个词的排序值
* 词尾的通配符
“” 定义一个短语(与单个词的列表不一样,它匹配整个短语以便包含或排除这个短语)

 

 mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('+rabbit +bait' IN BOOLEAN MODE);

这个搜索匹配包含词rabbit和bait的行。

 mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('rabbit bait' IN BOOLEAN MODE);

没有指定操作符,这个搜索匹配包含rabbit和bait中的至少一个词的行。

 mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('"rabbit bait"' IN BOOLEAN MODE);

这个搜索匹配短语rabbit bait而不是匹配两个词rabbit和bait。

 mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('>rabbit <carrot' IN BOOLEAN MODE);

匹配rabbit和carrot,增加前者的等级,降低后者的等级。

 mysql> SELECT note_text FROM productnotes WHERE Match(note_text) Against('+safe +(<combination)' IN BOOLEAN MODE);

这个搜索匹配词safe和combination,降低后者的等级。

18.2.5 全文本搜索的使用说明

在结束本章之前,给出关于全文本搜索的某些重要的说明。
 在索引全文本数据时,短词被忽略且从索引中排除。短词定义为那些具有3个或3个以下字符的词 (如果需要,这个数目可以更改)。
 MySQL带有一个内建的非用词( stopword)列表,这些词在索引 全文本数据时总是被忽略。如果需要,可以覆盖这个列表(请参阅MySQL文档以了解如何完成此工作)。
 许多词出现的频率很高,搜索它们没有用处(返回太多的结果)。因此, MySQL规定了一条50%规则,如果一个词出现在50%以上的行中,则将它作为一个非用词忽略。 50%规则不用于IN BOOLEAN MODE。
 如果表中的行数少于3行,则全文本搜索不返回结果(因为每个词或者不出现,或者至少出现在50%的行中)。
 忽略词中的单引号。例如, don’t索引为dont。
 不具有词分隔符(包括日语和汉语)的语言不能恰当地返回全文本搜索结果。
 如前所述,仅在MyISAM数据库引擎中支持全文本搜索。

第十九章  插 入 数 据

19.1 数据插入

插入及系统安全:可针对每个表或每个用户,利用MySQL的安全机制禁止使用INSERT语句,这将在第28章介绍。

19.2 插入完整的行

把数据插入表中的最简单的方法是使用基本的INSERT语法,它要求指定表名和被插入到新行中的值。下面举一个例子:

mysql> INSERT INTO customers VALUES(NULL,
    ->                       'Pep E. LaPew',
    ->                       '100 Main Street',
    ->                       'Los Angeles',
    ->                       'CA',
    ->                       '90046',
    ->                       'USA',
    ->                       NULL,
    ->                       NULL);
Query OK, 1 row affected (0.05 sec)

存储到每个表列中的数据在VALUES子句中给出,对每个列必须提供一个值。 如果某个列没有值 ,应该使用NULL值。各个列必须以它们在表定义中出现的次序填充。 你不想给出一个值 ,又不
能省略此列 (如前所述,必须给出每个列),所以指定一个NULL值。 (它被MySQL忽略, MySQL在这里插入下一个可用的cust_id值)。

虽然这种语法很简单,但并不安全,应该尽量避免使用。上面的SQL语句高度依赖于表中列的定义次序,并且还依赖于其次序容易获得的信息。即使可得到这种次序信息,也不能保证下一次表结构变动后各个列保持完全相同的次序。因此,编写依赖于特定列次序的SQL语句是很不安全的。

没有输出:INSERT语句一般不会产生输出。

编写INSERT语句的更安全(不过更烦琐)的方法如下:

mysql> INSERT INTO customers(cust_name,
    ->                       cust_address,
    ->                       cust_city,
    ->                       cust_state,
    ->                       cust_zip,
    ->                       cust_country,
    ->                       cust_contact,
    ->                       cust_email)
    ->            VALUES('Pep E. LaPew',
    ->                   '100 Main Street',
    ->                   'Los Angeles',
    ->                   'CA',
    ->                   '90046',
    ->                   'USA',
    ->                   NULL,
    ->                   NULL);
Query OK, 1 row affected (0.04 sec)

上述例子在表名后的括号里明确地给出了列名。在插入行时, MySQL将用VALUES列表中的相应值填入列表中的对应项。 VALUES中的第一个值对应于第一个指定的列名。第二个值对应于第二个列名,如此等等。

因为提供了列名, VALUES必须以其指定的次序匹配指定的列名,不一定按各个列出现在实际表中的次序。其优点是,即使表的结构改变,此INSERT语句仍然能正确工作。

总是使用列的列表 一般不要使用没有明确给出列的列表的INSERT语句。使用列的列表能使SQL代码继续发挥作用,即使表结构发生了变化。

仔细地给出值 不管使用哪种INSERT语法,都必须给出VALUES的正确数目。如果不提供列名,则必须给每个表列提供一个值。如果提供列名,则必须对每个列出的列给出一个值。如果不这样,将产生一条错误消息,相应的行插入不成功。

使用这种语法,还可以省略列。这表示可以只给某些列提供值,给其他列不提供值。(事实上你已经看到过这样的例子:当列名被明确列出时, cust_id可以省略。)

省略列 如果表的定义允许,则可以在INSERT操作中省略某些列。省略的列必须满足以下某个条件。
 该列定义为允许NULL值(无值或空值)。
 在表定义中给出默认值。这表示如果不给出值,将使用默认值。
如果对表中不允许NULL值且没有默认值的列不给出值,则MySQL将产生一条错误消息,并且相应的行插入不成功。

提高整体性能 数据库经常被多个客户访问,对处理什么请求以及用什么次序处理进行管理是MySQL的任务。 INSERT操作可能很耗时(特别是有很多索引需要更新时),而且它可能降低等待处理的SELECT语句的性能。
如果数据检索是最重要的(通常是这样),则你可以通过在INSERT和INTO之间添加关键字LOW_PRIORITY,指示MySQL降低INSERT语句的优先级,如下所示:

 mysql> INSERT LOW_PRIORITY INTO

顺便说一下,这也适用于下一章介绍的UPDATE和DELETE语句。

19.3 插入多个行

可以使用多条INSERT语句,甚至一次提交它们,每条语句用一个分号结束,如下所示:

 INSERT INTO customers(cust_name,
                      cust_address,
                      cust_city,
                      cust_state,
                      cust_zip,
                      cust_country)
            VALUES('Pep E. LaPew',
                   '100 Main Street',
                   'Los Angeles',
                   'CA',
                   '90046',
                   'USA');
INSERT INTO customers(cust_name,
                      cust_address,
                      cust_city,
                      cust_state,
                      cust_zip,
                      cust_country)
            VALUES('M. Martian',
                   '42 Galaxy Way',
                   'New York',
                   'NY',
                   '11213',
                   'USA');
mysql> source /home/learning/insert
  Query OK, 1 row affected (0.04 sec)

  Query OK, 1 row affected (0.03 sec)

或者,只要每条INSERT语句中的列名(和次序)相同,可以如下组合各语句:

mysql> INSERT INTO customers(cust_name,
    ->                       cust_address,
    ->                       cust_city,
    ->                       cust_state,
    ->                       cust_zip,
    ->                       cust_country)
    ->             VALUES('Pep E. LaPew',
    ->                    '100 Main Street',
    ->                    'Los Angeles',
    ->                    'CA',
    ->                    '90046',
    ->                    'USA'),
    ->                    ('M. Martian',
    ->                    '42 Galaxy Way',
    ->                    'New York',
    ->                    'NY',
    ->                    '11213',
    ->                    'USA');
Query OK, 2 rows affected (0.03 sec)
Records: 2  Duplicates: 0  Warnings: 0

其中单条INSERT语句有多组值,每组值用一对圆括号括起来,用逗号分隔。

提高INSERT的性能:此技术可以提高数据库处理的性能,因为MySQL用单条INSERT语句处理多个插入比使用多条INSERT语句快。

19.4 插入检索出的数据

INSERT还存在另一种形式,可以利用它将一条SELECT语句的结果插入表中。这就是所谓的INSERT SELECT,顾名思义,它是由一条INSERT语句和一条SELECT语句组成的。

假如你想从另一表中合并客户列表到你的customers表。 不需要每次读取一行,然后再将它用INSERT插入,可以如下进行:

mysql> INSERT INTO customers(cust_id, 
    ->                       cust_contact,
    ->                       cust_email,
    ->                       cust_name,
    ->                       cust_address,
    ->                       cust_city,
    ->                       cust_state,
    ->                       cust_zip,
    ->                       cust_country)
    -> SELECT cust_id,
    ->        cust_contact,
    ->        cust_email,
    ->        cust_name,
    ->        cust_address,
    ->        cust_city,
    ->        cust_state,
    ->        cust_zip,
    ->        cust_country
    -> FROM custnew;

这个例子使用INSERT SELECT从custnew中将所有数据导入customers。 SELECT语句从custnew检索出要插入的值,而不是列出它们。 SELECT中列出的每个列对应于customers表名后所跟的列
表中的每个列。这条语句将插入多少行有赖于custnew表中有多少行。
如果这个表为空,则没有行被插入(也不产生错误,因为操作仍然是合法的)。如果这个表确实含有数据,则所有数据将被插入到customers。
这个例子导入了cust_id(假设你能够确保cust_id的值不重复)。你也可以简单地省略这列(从INSERT和SELECT中),这样MySQL就会生成新值。

INSERT SELECT中的列名 为简单起见,这个例子在INSERT和SELECT语句中使用了相同的列名。但是,不一定要求列名匹配。事实上, MySQL甚至不关心SELECT返回的列名。它使用的是
列的位置,因此SELECT中的第一列(不管其列名)将用来填充表列中指定的第一个列,第二列将用来填充表列中指定的第二个列,如此等等。这对于从使用不同列名的表中导入数据是非常有用的。

INSERT SELECT中SELECT语句可包含WHERE子句以过滤插入的数据。

第二十章  更新和删除数据

20.1 更新数据

为了更新(修改)表中的数据,可使用UPDATE语句。可采用两种方式使用UPDATE:
 更新表中特定行;
 更新表中所有行。

不要省略WHERE子句:在使用UPDATE时一定要注意细心。因为稍不注意,就会更新表中所有行。

UPDATE语句非常容易使用,甚至可以说是太容易使用了。基本的UPDATE语句由3部分组成,分别是:
 要更新的表;

 列名和它们的新值;

 确定要更新行的过滤条件。

例子:

mysql> UPDATE customers SET cust_email='elmer@fudd.com' WHERE cust_id=10005;
  Query OK, 1 row affected (0.05 sec)
  Rows matched: 1  Changed: 1  Warnings: 0

上述例子中where子句很重要。没有WHERE子句, MySQL将会用这个电子邮件地址更新customers表中所有行,这不是我们所希望的。

更新多个列的语法稍有不同:

mysql> UPDATE customers SET cust_name='The Fudds', cust_email='elmer@fudd.com' WHERE cust_id=10005;
  Query OK, 1 row affected (0.04 sec)
  Rows matched: 1  Changed: 1  Warnings: 0

在更新多个列时,只需要使用单个SET命令,每个“列=值”对之间用逗号分隔(最后一列之后不用逗号)。

在UPDATE语句中使用子查询:UPDATE语句中可以使用子查询,使得能用SELECT语句检索出的数据更新列数据。

IGNORE关键字 如果用UPDATE语句更新多行,并且在更新这些行中的一行或多行时出一个现错误,则整个UPDATE操作被取消(错误发生前更新的所有行被恢复到它们原来的值)。为即使是发
生错误,也继续进行更新,可使用IGNORE关键字,如下所示:

UPDATE IGNORE customers…

为了删除某个列的值,可设置它为NULL(假如表定义允许NULL值)。如下进行:

mysql> UPDATE customers SET cust_email=NULL WHERE cust_id=10005;
  Query OK, 1 row affected (0.04 sec)
  Rows matched: 1  Changed: 1  Warnings: 0

20.2 删除数据

为了从一个表中删除(去掉)数据,使用DELETE语句。可以两种方式使用DELETE:
 从表中删除特定的行;
 从表中删除所有行。

不要省略WHERE子句 在使用DELETE时一定要注意细心。因为稍不注意,就会错误地删除表中所有行。

下面的语句从customers表中删除一行:

mysql> DELETE FROM customers WHERE cust_id = 10012;
  Query OK, 1 row affected (0.03 sec)

DELETE FROM要求指定从中删除数据的表名。WHERE子句过滤要删除的行。

DELETE不需要列名或通配符。 DELETE删除整行而不是删除列。为了删除指定的列,请使用UPDATE语句。

删除表的内容而不是表:DELETE语句从表中删除行,甚至是删除表中所有行。但是, DELETE不删除表本身。

更快的删除:如果想从表中删除所有行,不要使用DELETE。可使用TRUNCATE TABLE语句,它完成相同的工作,但速度更快( TRUNCATE实际是删除原来的表并重新创建一个表,而不是逐行删除表中的数据)。

20.3 更新和删除的指导原则

下面是许多SQL程序员使用UPDATE或DELETE时所遵循的习惯。
 除非确实打算更新和删除每一行,否则绝对不要使用不带WHERE子句的UPDATE或DELETE语句。
 保证每个表都有主键(如果忘记这个内容,请参阅第15章),尽可能像WHERE子句那样使用它(可以指定各主键、多个值或值的范围)。
 在对UPDATE或DELETE语句使用WHERE子句前,应该先用SELECT进行测试,保证它过滤的是正确的记录,以防编写的WHERE子句不正确。
 使用强制实施引用完整性的数据库

小心使用:MySQL没有撤销( undo)按钮。应该非常小心地使用UPDATE和DELETE,否则你会发现自己更新或删除了错误的数据。

第二十一章  创建和操纵表

21.1 创建表

一般有两种创建表的方法:
 使用具有交互式创建和管理表的工具(如第2章讨论的工具);
 表也可以直接用MySQL语句操纵。

为了用程序创建表,可使用SQL的CREATE TABLE语句。值得注意的是,在使用交互式工具时,实际上使用的是MySQL语句。但是,这些语句不是用户编写的,界面工具会自动生成并执行相应的MySQL语句(更改现有表时也是这样)。

21.1.1 表创建基础

为利用CREATE TABLE创建表,必须给出下列信息:
 新表的名字,在关键字CREATE TABLE之后给出;
 表列的名字和定义,用逗号分隔。

CREATE TABLE customers
(
  cust_id      int       NOT NULL AUTO_INCREMENT,
  cust_name    char(50)  NOT NULL ,
  cust_address char(50)  NULL ,
  cust_city    char(50)  NULL ,
  cust_state   char(5)   NULL ,
  cust_zip     char(10)  NULL ,
  cust_country char(50)  NULL ,
  cust_contact char(50)  NULL ,
  cust_email   char(255) NULL ,
  PRIMARY KEY (cust_id)
) ENGINE=InnoDB;

CREATE TABLE语句也可能会包括其他关键字或选项,但至少要包括表的 表名紧跟在CREATE TABLE关键字后面。实际的表定义(所有列)括在圆括号之中。各列之间用逗号分隔。名字和列的细节。 每列的定义以列名(它在表中必须是唯一的)开始,后跟列的数据类型。 表的主键可以在创建表时用PRIMARY KEY关键字指定。整条语句由 右 圆 括 号 后 的 分 号 结 束 。

处理现有的表 在创建新表时,指定的表名必须不存在,否则将出错。如果要防止意外覆盖已有的表, SQL要求首先手工删除该表(请参阅后面的小节),然后再重建它,而不是简单地用创建表语句覆盖它。

如果你仅想在一个表不存在时创建它,应该在表名后给出IF NOT EXISTS。这样做不检查已有表的模式是否与你打算创建的表模式相匹配。它只是查看表名是否存在,并且仅在表名不存在时创建它。

21.1.2 使用NULL值

NULL值就是没有值或缺值。允许NULL值的列也允许在插入行时不给出该列的值。不允许NULL值的列不接受该列没有值的行,换句话说,在插入或更新行时,该列必须有值。

每个表列或者是NULL列,或者是NOT NULL列,这种状态在创建时由表的定义规定。

CREATE TABLE orders
(
  order_num  int      NOT NULL AUTO_INCREMENT,
  order_date datetime NOT NULL ,
  cust_id    int      NOT NULL ,
  PRIMARY KEY (order_num)
) ENGINE=InnoDB;

所有3个列都需要,因此每个列的定义都含有关键字NOT NULL。

NULL为默认设置,如果不指定NOT NULL,则认为指定的是NULL。

理解NULL 不要把NULL值与空串相混淆。 NULL值是没有值,它不是空串。如果指定”(两个单引号,其间没有字符),这在NOT NULL列中是允许的。空串是一个有效的值,它不是无值。 NULL值用关键字NULL而不是空串指定。

21.1.3 主键再介绍

主键值必须唯一。即,表中的每个行必须具有唯一的主键值。如果主键使用单个列,则它的值必须唯一。如果使用多个列,则这些列的组合值必须唯一。

为创建由多个列组成的主键,应该以逗号分隔的列表给出各列名,如下所示:

CREATE TABLE orderitems
(
  order_num  int          NOT NULL ,
  order_item int          NOT NULL ,
  prod_id    char(10)     NOT NULL ,
  quantity   int          NOT NULL ,
  item_price decimal(8,2) NOT NULL ,
  PRIMARY KEY (order_num, order_item)
) ENGINE=InnoDB;

主键可以在创建表时定义(如这里所示), 或者在创建表之后定义。

主键和NULL值:第1章介绍过,主键为其值唯一标识表中每个行的列。主键中只能使用不允许NULL值的列。允许NULL值的列不能作为唯一标识。

21.1.4 使用AUTO_INCREMENT

AUTO_INCREMENT告诉MySQL,本列每当增加一行时自动增量。每次执行一个INSERT操作时, MySQL自动对该列增量(从而才有这个关键字AUTO_INCREMENT),给该列赋予下一个可用的值。这样给每个行分配一个唯一的cust_id,从而可以用作主键值。

每个表只允许一个AUTO_INCREMENT列,而且它必须被索引(如,通过使它成为主键)。

覆盖AUTO_INCREMENT:如果一个列被指定为AUTO_INCREMENT,则它需要使用特殊的值吗?你可以简单地在INSERT语句中指定一个值,只要它是唯一的(至今尚未使用过)即可,该值将被用来替代自动生成的值。后续的增量将开始使用该手工插入的值。

确定AUTO_INCREMENT值:

让MySQL生成(通过自动增量)主键的一个缺点是你不知道这些值都是谁。

如何在使用AUTO_INCREMENT列时获得这个值呢?可使用last_insert_id()函数获得这个值,如下所示:

mysql> SELECT last_insert_id();
+------------------+
| last_insert_id() |
+------------------+
|                0 |
+------------------+
1 row in set (0.00 sec)

此语句返回最后一个AUTO_INCREMENT值,然后可以将它用于后续的MySQL语句。

21.1.5 指定默认值

如果在插入行时没有给出值, MySQL允许指定此时使用的默认值。默认值用CREATE TABLE语句的列定义中的DEFAULT关键字指定。

CREATE TABLE orderitems
(
  order_num  int          NOT NULL ,
  order_item int          NOT NULL ,
  prod_id    char(10)     NOT NULL ,
  quantity   int          NOT NULL DEFAULT 1,
  item_price decimal(8,2) NOT NULL ,
  PRIMARY KEY (order_num, order_item)
) ENGINE=InnoDB;

不允许函数:与大多数DBMS不一样, MySQL不允许使用函数作为默认值,它只支持常量。

使用默认值而不是NULL值:许多数据库开发人员使用默认值而不是NULL列,特别是对用于计算或数据分组的列更是如此。

21.1.6 引擎类型

MySQL有一个具体管理和处理数据的内部引擎。在你使用CREATE TABLE语句时,该引擎具体创建表,而在你使用SELECT语句或进行其他数据库处理时,该引擎在内部处理你的请求。 多数时候,此引擎都隐藏在DBMS内,不需要过多关注它。

但MySQL与其他DBMS不一样,它具有多种引擎。它打包多个引擎,这些引擎都隐藏在MySQL服务器内,全都能执行CREATE TABLE和SELECT等命令。

你完全可以忽略这些数据库引擎。如果省略ENGINE=语句,则使用默认引擎(很可能是MyISAM),多数SQL语句都会默认使用它。但并不是所有语句都默认使用它,这就是为什么ENGINE=语句很重要的原因。

以下是几个需要知道的引擎:
 InnoDB是一个可靠的事务处理引擎(参见第26章),它不支持全文本搜索;
 MEMORY在功能等同于MyISAM, 但由于数据存储在内存(不是磁盘)中,速度很快(特别适合于临时表);
 MyISAM是一个性能极高的引擎,它支持全文本搜索(参见第18章),但不支持事务处理。

引擎类型可以混用。除productnotes表使用MyISAM外,本书中的样例表都使用InnoDB。 原因是作者希望支持事务处理(因此,使用InnoDB),但也需要在productnotes中支持全文本搜索(因此,使用MyISAM)。

外键不能跨引擎:混用引擎类型有一个大缺陷。外键(用于强制实施引用完整性,如第1章所述)不能跨引擎,即使用一个引擎的表不能引用具有使用不同引擎的表的外键。

MyISAM由于其性能和特性可能是最受欢迎的引擎。但如果你不需要可靠的事务处理,可以使用其他引擎。

21.2 更新表

为更新表定义,可使用ALTER TABLE语句。

为了使用ALTER TABLE更改表结构,必须给出下面的信息:
 在ALTER TABLE之后给出要更改的表名(该表必须存在,否则将出错);
 所做更改的列表。

给表添加一个列:

mysql> ALTER TABLE vendors ADD vend_phone CHAR(20);
  Query OK, 0 rows affected (0.52 sec)
  Records: 0  Duplicates: 0  Warnings: 0

删除列:

mysql> ALTER TABLE vendors DROP COLUMN vend_phone;
  Query OK, 0 rows affected (0.50 sec)
  Records: 0  Duplicates: 0  Warnings: 0

ALTER TABLE的一种常见用途是定义外键:

 ALTER TABLE orders ADD CONSTRAINT fk_orders_customers FOREIGN KEY (cust_id) REFERENCES customers (cust_id);

复杂的表结构更改一般需要手动删除过程,它涉及以下步骤:
 用新的列布局创建一个新表;
 使用INSERT SELECT语句(关于这条语句的详细介绍,请参阅第 19章)从旧表复制数据到新表。如果有必要,可使用转换函数和计算字段;
 检验包含所需数据的新表;
 重命名旧表(如果确定,可以删除它);
 用旧表原来的名字重命名新表;
 根据需要,重新创建触发器、存储过程、索引和外键。

小心使用ALTER:TABLE 使用ALTER TABLE要极为小心,应该在进行改动前做一个完整的备份(模式和数据的备份)。数据库表的更改不能撤销,如果增加了不需要的列,可能不能删
除它们。类似地,如果删除了不应该删除的列,可能会丢失该列中的所有数据。

21.3 删除表

删除表(删除整个表而不是其内容)非常简单,使用DROP TABLE语句即可:

 mysql> DROP TABLE vendors;

删除表没有确认,也不能撤销,执行这条语句将永久删除该表。

21.4 重命名表

使用RENAME TABLE语句可以重命名一个表:

mysql> RENAME TABLE vendors TO vendors2;
  Query OK, 0 rows affected (0.14 sec)

使用下面的语句对多个表重命名:

mysql> RENAME TABLE vendors TO vendors2,
    ->              customers TO customers;

第二十二章  使 用 视 图

22.1 视图

视图是虚拟的表。与包含数据的表不一样,视图只包含使用时动态检索数据的查询。

视图不包含表中应该有的任何列或数据,它包含的是一个SQL查询(与上面用以正确联结表的相同的查询)。

22.1.1 为什么使用视图

我们已经看到了视图应用的一个例子。下面是视图的一些常见应用。
重用SQL语句。
简化复杂的SQL操作。在编写查询后,可以方便地重用它而不必知道它的基本查询细节。
使用表的组成部分而不是整个表。
保护数据。可以给用户授予表的特定部分的访问权限而不是整个表的访问权限。
更改数据格式和表示。视图可返回与底层表的表示和格式不同的数据。

在视图创建之后,可以用与表基本相同的方式利用它们。可以对视图执行SELECT操作,过滤和排序数据,将视图联结到其他视图或表,甚至能添加和更新数据(添加和更新数据存在某些限制。关于这个内容稍后还要做进一步的介绍)。

视图仅仅是用来查看存储在别处的数据的一种设施。视图本身不包含数据,因此它们返回的数据是从其他表中检索出来的。在添加或更改这些表中的数据时,视图将返回改变过的数据。

性能问题:因为视图不包含数据,所以每次使用视图时,都必须处理查询执行时所需的任一个检索。如果嵌套了很多的视图,性能会下降很快。因此,在部署使用了大量视图的应用前,应该进行测试。

22.1.2 视图的规则和限制

下面是关于视图创建和使用的一些最常见的规则和限制。
1.与表一样,视图必须唯一命名(不能给视图取与别的视图或表相同的名字)。
2.对于可以创建的视图数目没有限制。
3.为了创建视图,必须具有足够的访问权限。这些限制通常由数据库管理人员授予。
4. 视图可以嵌套,即可以利用从其他视图中检索数据的查询来构造一个视图。
5.ORDER BY可以用在视图中,但如果从该视图检索数据SELECT中也含有ORDER BY,那么该视图中的ORDER BY将被覆盖。
6. 视图不能索引,也不能有关联的触发器或默认值。
7. 视图可以和表一起使用。例如,编写一条联结表和视图的SELECT

22.2 使用视图

1. 视图用CREATE VIEW语句来创建。
2. 使用SHOW CREATE VIEW viewname;来查看创建视图的语句。
3. 用DROP删除视图,其语法为DROP VIEW viewname;。
4. 更新视图时,可以先用DROP再用CREATE,也可以直接用CREATE OR REPLACE VIEW。如果要更新的视图不存在,则第2条更新语句会创建一个视图;如果要更新的视图存在,则第2条更新语句会替换原有视图。

22.2.1 利用视图简化复杂的联结

视图的最常见的应用之一是隐藏复杂的SQL,这通常都会涉及联结。

mysql> CREATE VIEW productcustomers AS
    ->        SELECT cust_name,cust_contact,prod_id
    ->               FROM customers,orders,orderitems
    ->               WHERE customers.cust_id=orders.cust_id
    ->                 AND orderitems.order_num=orders.order_num;
Query OK, 0 rows affected (0.05 sec)

为检索订购了产品TNT2的客户,可如下进行:

mysql> SELECT cust_name,cust_contact FROM productcustomers WHERE prod_id='TNT2';
+----------------+--------------+
| cust_name      | cust_contact |
+----------------+--------------+
| Coyote Inc.    | Y Lee        |
| Yosemite Place | Y Sam        |
+----------------+--------------+
2 rows in set (0.00 sec)

在MySQL处理此查询时,它将指定的WHERE子句添加到视图查询中的已有WHERE子句中,以便正确过滤数据。

可以看出,视图极大地简化了复杂SQL语句的使用。利用视图,可一次性编写基础的SQL,然后根据需要多次使用。

创建可重用的视图:创建不受特定数据限制的视图是一种好办法。例如,上面创建的视图返回生产所有产品的客户而不仅仅是生产TNT2的客户。扩展视图的范围不仅使得它能被重用,而且甚至更有用。这样做不需要创建和维护多个类似视图。

22.2.2 用视图重新格式化检索出的数据

视图的另一常见用途是重新格式化检索出的数据。

mysql> CREATE VIEW vendorlocations AS
    ->        SELECT Concat(RTrim(vend_name), '(', RTrim(vend_country), ')') 
    ->               FROM vendors
    ->               ORDER BY vend_name;
Query OK, 0 rows affected (0.04 sec)

 

mysql> SELECT * FROM vendorlocations;
+---------------------------------------------------------+
| Concat(RTrim(vend_name), '(', RTrim(vend_country), ')') |
+---------------------------------------------------------+
| ACME(USA)                                               |
| Anvils R Us(USA)                                        |
| Furball Inc.(USA)                                       |
| Jet Set(England)                                        |
| Jouets Et Ours(France)                                  |
| LT Supplies(USA)                                        |
+---------------------------------------------------------+
6 rows in set (0.00 sec)

22.2.3 用视图过滤不想要的数据

mysql> CREATE VIEW customeremaillist AS
    ->        SELECT cust_id, cust_name, cust_email
    ->               FROM customers
    ->               WHERE cust_email IS NOT NULL;
Query OK, 0 rows affected (0.04 sec)

这里的WHERE子句过滤了cust_email列中具有NULL值的那些行,使他们不被检索出来。

mysql> SELECT * FROM customeremaillist;
+---------+----------------+---------------------+
| cust_id | cust_name      | cust_email          |
+---------+----------------+---------------------+
|   10001 | Coyote Inc.    | ylee@coyote.com     |
|   10003 | Wascals        | rabbit@wascally.com |
|   10004 | Yosemite Place | sam@yosemite.com    |
+---------+----------------+---------------------+
3 rows in set (0.00 sec)

WHERE子句与WHERE子句 如果从视图检索数据时使用了一条WHERE子句,则两组子句(一组在视图中,另一组是传递给视图的)将自动组合。

22.2.4 使用视图与计算字段

视图对于简化计算字段的使用特别有用。

mysql> CREATE VIEW orderitemexpanded AS
    ->        SELECT order_num,
    ->               prod_id,
    ->               quantity,
    ->               item_price,
    ->               quantity * item_price AS expanded_price
    ->        FROM orderitems;
Query OK, 0 rows affected (0.05 sec)

 

mysql> SELECT * FROM orderitemexpanded WHERE order_num=20005;
+-----------+---------+----------+------------+----------------+
| order_num | prod_id | quantity | item_price | expanded_price |
+-----------+---------+----------+------------+----------------+
|     20005 | ANV01   |       10 |       5.99 |          59.90 |
|     20005 | ANV02   |        3 |       9.99 |          29.97 |
|     20005 | TNT2    |        5 |      10.00 |          50.00 |
|     20005 | FB      |        1 |      10.00 |          10.00 |
+-----------+---------+----------+------------+----------------+
4 rows in set (0.00 sec)

可以看到,视图非常容易创建,而且很好使用。正确使用,视图可极大地简化复杂的数据处理。

22.2.5 更新视图

视图是可更新的(即,可以对它们使用INSERT、 UPDATE和DELETE)。更新一个视图将更新其基表(可以回忆一下,视图本身没有数据)。如果你对视图增加或删除行,实际上是对其基表增加或删除行。

并非所有视图都是可更新的。基本上可以说,如果MySQL不能正确地确定被更新的基数据,则不允许更新(包括插入和删除)。这实际上意味着,如果视图定义中有以下操作,则不能进行视图的更新:

1. 分组(使用GROUP BY和HAVING);
2. 联结;
3. 子查询;
4. 并;
5. 聚集函数( Min()、 Count()、 Sum()等);
6. DISTINCT;
7. 导出(计算)列。

换句话说,本章许多例子中的视图都是不可更新的。这听上去好像是一个严重的限制,但实际上不是,因为视图主要用于数据检索。

第二十三章 使用存储过程

23.1 存储过程

存储过程简单来说,就是为以后的使用而保存的一条或多条MySQL语句的集合。可将其视为批文件,虽然它们的作用不仅限于批处理。

23.2 为什么要使用存储过程

使用存储过程有3个主要的好处,即简单、安全、高性能。显然,它们都很重要。不过,在将SQL代码转换为存储过程前,也必须知道它的一些缺陷。
1. 一般来说,存储过程的编写比基本SQL语句复杂,编写存储过程需要更高的技能,更丰富的经验。

2. 你可能没有创建存储过程的安全访问权限。许多数据库管理员限制存储过程的创建权限,允许用户使用存储过程,但不允许他们创建存储过程。

23.3 使用存储过程

23.3.1 执行存储过程

MySQL执行存储过程的语句为CALL。 CALL接受存储过程的名字以及需要传递给它的任意参数。

 

存储过程可以显示结果,也可以不显示结果。

23.3.2 创建存储过程

mysql> DELIMITER // # 这一句暂时将语句的终止符改成了//
mysql> CREATE PROCEDURE productprocing()
    -> BEGIN
    ->     SELECT Avg(prod_price) AS priceaverage FROM products;  # 如果没有改变终止符,在Mysql命令行中这里就直接终止了语句,导致运行错误。
    -> END //
Query OK, 0 rows affected (0.02 sec)
mysql> DELIMITER ;  # 这一句又将语句的终止符改回了;

此存储过程名为productpricing,用CREATE PROCEDURE productpricing()语句定义。BEGIN和END语句用来限定存储过程体,过程体本身仅是一个简单的SELECT语句。

注:mysql命令行客户机的分隔符:如果你使用的是mysql命令行实用程序,应该仔细阅读此说明。认的MySQL语句分隔符为;(正如你已经在迄今为止所使用的MySQL语句中所看到的那样)。 mysql命令行实用程序也使用;作为语句分隔符。如果命令行实用程序要解释存储过程自身内的;字符,则它们最终不会成为存储过程的成分,这会使存储过程中的SQL出现句法错误。

mysql> CREATE PROCEDURE productprocing()
    -> BEGIN 
    ->     SELECT Avg(prod_price) AS priceaverage FROM products;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '' at line 3
mysql> CREATE PROCEDURE productprocing() 
    -> BEGIN
    ->     SELECT Avg(prod_price) AS priceaverage FROM products
    -> END;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '' at line 4

解决办法是临时更改命令行实用程序的语句分隔符,如下所示:

mysql> DELIMITER //
mysql> CREATE PROCEDURE productprocing()
    -> BEGIN
    ->     SELECT Avg(prod_price) AS priceaverage FROM products; 
    -> END //
Query OK, 0 rows affected (0.02 sec)
mysql> DELIMITER ;

其中, DELIMITER //告诉命令行实用程序使用//作为新的语句结束分隔符,可以看到标志存储过程结束的END定义为END//而不是END;。这样,存储过程体内的;仍然保持不动,并且正确地传递给数据库引擎。最后,为恢复为原来的语句分隔符, 可使用DELIMITER ;。除\符号外,任何字符都可以用作语句分隔符。如果你使用的是mysql命令行实用程序,在阅读本章时请记住这里的内容。

调用这个存储过程:

mysql> call productprocing();
+--------------+
| priceaverage |
+--------------+
|    16.133571 |
+--------------+
1 row in set (0.00 sec)

Query OK, 0 rows affected (0.00 sec)

因为存储过程实际上是一种函数,所以存储过程名后需要有()符号(即使不传递参数也需要)。

23.3.3 删除存储过程

存储过程在创建之后,被保存在服务器上以供使用,直至被删除。删除命令从服务器中删除存储过程。

为删除刚创建的存储过程,可使用以下语句:

mysql> drop PROCEDURE productprocing;
Query OK, 0 rows affected (0.00 sec)

这条语句删除刚创建的存储过程。请注意没有使用后面的(),只给出存储过程名。

仅当存在时删除:如果指定的过程不存在,则DROP PROCEDURE将产生一个错误。当过程存在想删除它时(如果过程不存在也不产生错误)可使用DROP PROCEDURE IF EXISTS。

23.3.4 使用参数

一般,存储过程并不显示结果,而是把结果返回给你指定的变量。

变量( variable):内存中一个特定的位置,用来临时存储数据。

mysql> DELIMITER //
mysql> CREATE PROCEDURE productprocing(
    ->      OUT pl DECIMAL(8, 2),
    ->      OUT ph DECIMAL(8, 2),
    ->      OUT pa DECIMAL(8, 2)
    -> )
    -> BEGIN
    ->     SELECT Min(prod_price) INTO pl FROM products;
    ->     SELECT Max(prod_price) INTO ph FROM products;
    ->     SELECT Avg(prod_price) INTO pa FROM products;
    -> END //
Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

此存储过程接受3个参数。 每个参数必须具有指定的类型( 注意,记录集不是允许的类型,因此,不能通过一个参数返回多个行和列。)。 关键字OUT指出相应的参数用来从存储过程传出一个值(返回给调用者)。

MySQL支持IN(传递给存储过程)、 OUT(从存储过程传出,如这里所用)和INOUT(对存储过程传入和传出)类型的参数。

存储过程的代码位于BEGIN和END语句内,如前所见,它们是一系列SELECT语句,用来检索值,然后保存到相应的变量(通过指定INTO关键字)。

为调用此修改过的存储过程,必须指定3个变量名,如下所示:

mysql> CALL productprocing(@pricelow,
    ->                     @pricehigh,
    ->                     @priceaverage);
Query OK, 1 row affected, 1 warning (0.00 sec)

由于此存储过程要求3个参数,因此必须正好传递3个参数,不多也不少。所以,这条CALL语句给出3个参数。它们是存储过程将保存结果的3个变量的名字。

变量名:所有MySQL变量都必须以@开始。

在调用时,这条语句并不显示任何数据。它返回以后可以显示(或在其他处理中使用)的变量。

为了显示检索出的产品平均价格,可如下进行:

mysql> SELECT @priceaverage;
+---------------+
| @priceaverage |
+---------------+
|         16.13 |
+---------------+
1 row in set (0.00 sec)

为了获得3个值,可使用以下语句:

mysql> SELECT @pricehigh, @pricelow, @priceaverage;
+------------+-----------+---------------+
| @pricehigh | @pricelow | @priceaverage |
+------------+-----------+---------------+
|      55.00 |      2.50 |         16.13 |
+------------+-----------+---------------+
1 row in set (0.00 sec)

下面是另外一个例子,这次使用IN和OUT参数。 ordertotal接受订单号并返回该订单的合计:

mysql> DELIMITER //
mysql> CREATE PROCEDURE ordertotal(
    ->      IN onumber INT,
    ->      OUT ototal DECIMAL(8, 2)
    -> )
    -> BEGIN
    ->     SELECT Sum(item_price*quantity) FROM orderitems WHERE order_num=onumber INTO ototal;
    -> END //
Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

为调用这个新存储过程,可使用以下语句:

mysql> CALL ordertotal(20005, @total);
  Query OK, 1 row affected (0.00 sec)

必须给ordertotal传递两个参数;第一个参数为订单号,第二个参数为包含计算出来的合计的变量名。

为了显示此合计,可如下进行:

mysql> SELECT @total;
+--------+
| @total |
+--------+
| 149.87 |
+--------+
1 row in set (0.00 sec)

为了得到另一个订单的合计显示,需要再次调用存储过程,然后重新显示变量:

mysql> CALL ordertotal(20009, @total);
Query OK, 1 row affected (0.00 sec)

mysql> SELECT @total;
+--------+
| @total |
+--------+
|  38.47 |
+--------+
1 row in set (0.00 sec)

23.3.5 建立智能存储过程

mysql> DELIMITER //
mysql> -- Name: ordertotal
mysql> -- Parameters: onumber = order number
mysql> --             taxable = 0 if not taxable, 1 if taxable
mysql> --             ototal = order total variable
mysql> CREATE PROCEDURE ordertotal(
    ->      IN onumber INT,
    ->      IN taxable BOOLEAN,
    ->      OUT ototal DECIMAL(8, 2)
    -> )COMMENT 'Obtain order total, optionally adding tax'
    -> BEGIN
    ->     -- Declare variable for total
    ->     DECLARE total DECIMAL(8, 2);
    ->     -- Declare tax percentage
    ->     DECLARE taxrate INT DEFAULT 6;
    -> 
    ->     -- Get the order total 
    ->     SELECT Sum(item_price*quantity) FROM orderitems WHERE order_num=onumber INTO total;
    ->     -- Is this taxable?
    ->     IF taxable THEN
    ->         -- yes, so add taxrate to the total
    ->         SELECT total+(total/100*taxrate) INTO total;
    ->     END IF;
    ->     -- And finally, save to out variable
    ->     SELECT total INTO ototal;
    -> END //
Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

在存储过程体中,用DECLARE语句定义了两个局部变量。

DECLARE要求指定变量名和数据类型,它也支持可选的默认值(这个例子中的taxrate的默认被设置为6%)。

IF语句检查taxable是否为真,如果为真,则用另一SELECT语句增加营业税到局部变量total。最后,用另一SELECT语句将total(它增加或许不增加营业税)保存到ototal。

COMMENT关键字:本例子中的存储过程在CREATE PROCEDURE语句中包含了一个COMMENT值。它不是必需的,但如果给出,将在SHOW PROCEDURE STATUS的结果中显示。

这显然是一个更高级,功能更强的存储过程。为试验它,请用以下两条语句:

mysql> CALL ordertotal(20005, 0, @total);
Query OK, 1 row affected (0.00 sec)

mysql> SELECT @total;
+--------+
| @total |
+--------+
| 149.87 |
+--------+
1 row in set (0.00 sec)

BOOLEAN值指定为1表示真,指定为0表示假(实际上,非零值都考虑为真,只有0被视为假)。

IF语句:这个例子给出了MySQL的IF语句的基本用法。 IF语句还支持ELSEIF和ELSE子句(前者还使用THEN子句,后者不使用)。在以后章节中我们将会看到IF的其他用法(以及其他流控制语句)。

23.3.6 检查存储过程

为显示用来创建一个存储过程的CREATE语句,使用SHOW CREATE PROCEDURE语句:

mysql> SHOW CREATE PROCEDURE ordertotal;

为了获得包括何时、由谁创建等详细信息的存储过程列表, 使用SHOW PROCEDURE STATUS。

 mysql> SHOW PROCEDURE STATUS;
+----------+----------------+-----------+------------+---------------------+---------------------+---------------+-------------------------------------------+----------------------+----------------------+--------------------+
| Db       | Name           | Type      | Definer    | Modified            | Created             | Security_type | Comment                                   | character_set_client | collation_connection | Database Collation |
+----------+----------------+-----------+------------+---------------------+---------------------+---------------+-------------------------------------------+----------------------+----------------------+--------------------+
| learning | ordertotal     | PROCEDURE | learning@% | 2016-11-08 21:37:25 | 2016-11-08 21:37:25 | DEFINER       | Obtain order total, optionally adding tax | utf8                 | utf8_general_ci      | latin1_swedish_ci  |
| learning | productprocing | PROCEDURE | learning@% | 2016-11-08 21:03:13 | 2016-11-08 21:03:13 | DEFINER       |                                           | utf8                 | utf8_general_ci      | latin1_swedish_ci  |
+----------+----------------+-----------+------------+---------------------+---------------------+---------------+-------------------------------------------+----------------------+----------------------+--------------------+
2 rows in set (0.01 sec)

限制过程状态结果 SHOW PROCEDURE STATUS列出所有存储过程。为限制其输出,可使用LIKE指定一个过滤模式,例如:

mysql> SHOW PROCEDURE STATUS LIKE 'productprocing'; # 注意这里是有单引号的
+----------+----------------+-----------+------------+---------------------+---------------------+---------------+---------+----------------------+----------------------+--------------------+
| Db       | Name           | Type      | Definer    | Modified            | Created             | Security_type | Comment | character_set_client | collation_connection | Database Collation |
+----------+----------------+-----------+------------+---------------------+---------------------+---------------+---------+----------------------+----------------------+--------------------+
| learning | productprocing | PROCEDURE | learning@% | 2016-11-08 21:03:13 | 2016-11-08 21:03:13 | DEFINER       |         | utf8                 | utf8_general_ci      | latin1_swedish_ci  |
+----------+----------------+-----------+------------+---------------------+---------------------+---------------+---------+----------------------+----------------------+--------------------+
1 row in set (0.00 sec)

第二十四章  使 用 游 标

24.1 游标

如果没有使用游标, MySQL检索操作返回一组称为结果集的行。

游标 ( cursor) 是一个存储在MySQL服务器上的数据库查询,它不是一条SELECT语句,而是被该语句检索出来的结果集。在存储了游标之后,应用程序可以根据需要滚动或浏览其中的数据。

只能用于存储过程 不像多数DBMS, MySQL游标只能用于存储过程(和函数)。

24.2 使用游标

使用游标涉及几个明确的步骤。

 在能够使用游标前,必须声明(定义)它。这个过程实际上没有检索数据,它只是定义要使用的SELECT语句。
 一旦声明后,必须打开游标以供使用。这个过程用前面定义的SELECT语句把数据实际检索出来。
 对于填有数据的游标,根据需要取出(检索)各行。
 在结束游标使用时,必须关闭游标。

24.2.1 创建游标

mysql> DELIMITER //
mysql> CREATE PROCEDURE processorders()
    -> BEGIN
    ->     DECLARE ordernumbers CURSOR
    ->     FOR
    ->     SELECT order_num FROM orders;
    -> END //
Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

DECLARE语句用来定义和命名游标,这里为ordernumbers。 存储过程处理完成后,游标就消失(因为它局限于存储过程)。
在定义游标之后,可以打开它。

24.2.2 打开和关闭游标

游标用OPEN CURSOR语句来打开:

mysql> OPEN ordernumbers;

在处理OPEN语句时执行查询,存储检索出的数据以供浏览和滚动。

游标处理完成后,应当使用如下语句关闭游标:

 mysql> CLOSE ordernumbers;

CLOSE释放游标使用的所有内部内存和资源,因此在每个游标不再需要时都应该关闭。

在一个游标关闭后,如果没有重新打开,则不能使用它。但是,使用声明过的游标不需要再次声明,用OPEN语句打开它就可以了。

隐含关闭 如果你不明确关闭游标, MySQL将会在到达END语句时自动关闭它。

mysql> CREATE PROCEDURE processorders()
    -> BEGIN
    ->     -- Declare the cursor
    ->     DECLARE ordernumbers CURSOR
    ->     FOR
    ->     SELECT order_num FROM orders;
    ->  
    ->     -- Open the cursor
    ->     OPEN ordernumbers;
    -> 
    ->     -- Close the cursor
    ->     CLOSE ordernumbers;
    -> END //
Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

这个存储过程声明、打开和关闭一个游标。但对检索出的数据什么也没做。

24.2.3 使用游标数据

在一个游标被打开后,可以使用FETCH语句分别访问它的每一行。FETCH指定检索什么数据(所需的列),检索出来的数据存储在什么地方。它还向前移动游标中的内部行指针,使下一条FETCH语句检索下一行(不重复读取同一行)。

mysql> DELIMITER //
mysql> CREATE PROCEDURE processorders()
    -> BEGIN
    ->     -- Declare local variables
    ->     DECLARE o INT;
    -> 
    ->     -- Declare the cursor
    ->     DECLARE ordernumbers CURSOR
    ->     FOR
    ->     SELECT order_num FROM orders;
    -> 
    ->     -- Open the cursor
    ->     OPEN ordernumbers;
    -> 
    ->     -- Get order number
    ->     FETCH ordernumbers INTO o;
    -> 
    ->     -- Close the cursor
    ->     CLOSE ordernumbers;
    -> END //
Query OK, 0 rows affected (0.01 sec)

mysql> DELIMITER ;

其中FETCH用来检索当前行的order_num列 (将自动从第一行开始)到一个名为o的局部声明的变量中。对检索出的数据不做任何处理。

mysql> DELIMITER //
mysql> CREATE PROCEDURE processorder()
    -> BEGIN
    ->     -- Declare local variables
    ->     DECLARE done BOOLEAN DEFAULT 0;
    ->     DECLARE o INT;
    -> 
    ->     -- Declare the cursor 
    ->     DECLARE ordernumbers CURSOR 
    ->     FOR 
    ->     SELECT order_num FROM orders;
    -> 
    ->     -- Declare continue handler
    ->     DECLARE CONTINUE HANDLER FOR SQLSTATE '02000' SET done=1;
    -> 
    ->     -- Open the cursor
    ->     OPEN ordernumbers;
    -> 
    ->     -- Loop through all rows
    ->     REPEAT
    ->     
    ->         -- Get order number
    ->         FETCH ordernumbers INTO o;
    ->     -- End of loop
    ->     UNTIL done END REPEAT;
    -> 
    ->     -- Close the cursor
    ->     CLOSE ordernumbers;
    -> END //
Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

与前一个例子一样,这个例子使用FETCH检索当前order_num到声明的名为o的变量中。但与前一个例子不一样的是,这个例子中的FETCH是在REPEAT内,因此它反复执行直到done为真(由UNTIL done END REPEAT;规定)。为使它起作用,用一个DEFAULT 0(假,不结束)定义变量done。那么, done怎样才能在结束时被设置为真呢?答案是用以下语句:

DECLARE CONTINUE HANDLER FOR SQLSTATE '02000' SET done=1;

这条语句定义了一个CONTINUE HANDLER,它是在条件出现时被执行的代码。这里, 它指出当SQLSTATE ‘02000’出现时, SET done=1。SQL STATE ‘02000’是一个未找到条件, 当REPEAT由于没有更多的行供循环而不能继续时,出现这个条件。

DECLARE语句的次序:DECLARE语句的发布存在特定的次序。用DECLARE语句定义的局部变量必须在定义任意游标或句柄之前定义,而句柄必须在游标之后定义。不遵守此顺序将产生错误消息

如 果 调 用 这 个 存 储 过 程 , 它 将 定 义 几 个 变 量 和 一 个 CONTINUE HANDLER,定义并打开一个游标,重复读取所有行,然后关闭游标。如果一切正常,你可以在循环内放入任意需要的处理(在FETCH语句之后,循环结束之前)。

重复或循环?:除这里使用的REPEAT语句外, MySQL还支持循环语句,它可用来重复执行代码,直到使用LEAVE语句手动退出为止。通常REPEAT语句的语法使它更适合于对游标进行循环。

mysql> DELIMITER //
mysql> CREATE PROCEDURE processorders()
    -> BEGIN 
    ->     -- Declare local variables 
    ->     DECLARE done BOOLEAN DEFAULT 0;
    ->     DECLARE o INT;
    ->     DECLARE t DECIMAL(8,2);
    -> 
    ->     -- Declare the cursor 
    ->     DECLARE ordernumbers CURSOR
    ->     FOR 
    ->     SELECT order_num FROM orders;
    ->     
    ->     -- Declare continue handler
    ->     DECLARE CONTINUE HANDLER FOR SQLSTATE '02000' SET done=1;
    -> 
    ->     -- Create a table to store the results
    ->     CREATE TABLE IF NOT EXISTS ordertotals (order_num INT, total DECIMAL(8, 2));
    -> 
    ->     -- Open the cursor
    ->     OPEN ordernumbers;
    -> 
    ->     -- Loop through all rows 
    ->     REPEAT 
    ->         -- Get order number
    ->         FETCH ordernumbers INTO o;
    ->         -- Get the total for this order
    ->         CALL ordertotal(o, 1, t);  // 上一章定义的存储过程
    -> 
    ->         -- Insert order and total into ordertotals
    ->         INSERT INTO ordertotals(order_num, total)
    ->         VALUES(o, t);
    ->     -- End of loop
    ->     UNTIL done END REPEAT;
    -> 
    ->     -- Close the cursor
    ->     CLOSE ordernumbers;
    -> END //
Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

我们增加了另一个名为t的变量(存储每个订单的合计)。 此存储过程还在运行中创建了一个新表(如果它不存在的话),名为ordertotals。这个表将保存存储过程生成的结果。FETCH像以前一样取每个order_num,然后用CALL执行另一个存储过程(我们在前一章中创建)来计算每个订单的带税的合计(结果存储到t)。最后,用INSERT保存每个订单的订单号和合计。

此存储过程不返回数据,但它能够创建和填充另一个表,可以用一条简单的SELECT语句查看该表:

mysql> CALL processorders();
Query OK, 1 row affected (0.28 sec)

mysql> SELECT * FROM ordertotals;
+-----------+---------+
| order_num | total   |
+-----------+---------+
|     20005 |  158.86 |
|     20009 |   40.78 |
|     20006 |   58.30 |
|     20007 | 1060.00 |
|     20008 |  132.50 |
|     20008 |  132.50 |
+-----------+---------+
6 rows in set (0.00 sec)

第二十五章 使用触发器

25.1 触发器

触发器是MySQL响应以下任意语句而自动执行的一条MySQL语句(或位于BEGIN和END语句之间的一组语句):
 DELETE;
 INSERT;
 UPDATE。
其他MySQL语句不支持触发器。

25.2 创建触发器

在创建触发器时,需要给出4条信息:
 唯一的触发器名;
 触发器关联的表;
 触发器应该响应的活动( DELETE、 INSERT或UPDATE);
 触发器何时执行(处理之前或之后)。
保持每个数据库的触发器名唯一:在MySQL 5中,触发器名必须在每个表中唯一,但不是在每个数据库中唯一。

触发器用CREATE TRIGGER语句创建。下面是一个简单的例子:

mysql> CREATE TRIGGER newproduct 
    ->        AFTER INSERT         //  触发器可在一个操作发生之前或之后执行,这里给出了AFTER INSERT,所以此触发器将在INSERT语句成功执行后执行。
    ->        ON products
    ->        FOR EACH ROW         //  这个触发器还指定FOREACH ROW,因此代码对每个插入行执行。
    ->        SELECT 'Product added'; //在新版的mysql中这一句是不合法的。

仅支持表:只有表才支持触发器,视图不支持(临时表也不支持)。

触发器按每个表每个事件每次地定义,每个表每个事件每次只允许一个触发器。因此,每个表最多支持6个触发器(每条INSERT、 UPDATE和DELETE的之前和之后)。单一触发器不能与多个事件或多个表关联,所以,如果你需要一个对INSERT和UPDATE操作执行的触发器,则应该定义两个触发器。

触发器失败:如果BEFORE触发器失败,则MySQL将不执行请求的操作。此外,如果BEFORE触发器或语句本身失败, MySQL将不执行AFTER触发器(如果有的话)。

25.3 删除触发器

为了删除一个触发器,可使用DROP TRIGGER语句,如下所示:

mysql> DROP TRIGGER newproduct;

触发器不能更新或覆盖。为了修改一个触发器,必须先删除它,然后再重新创建

25.4 使用触发器

25.4.1 INSERT触发器

INSERT触发器在INSERT语句执行之前或之后执行。需要知道以下几点:
 在INSERT触发器代码内,可引用一个名为NEW的虚拟表,访问被插入的行;
 在BEFORE INSERT触发器中, NEW中的值也可以被更新(允许更改被插入的值);
 对于AUTO_INCREMENT列, NEW在INSERT执行之前包含0,在INSERT执行之后包含新的自动生成值。

mysql> CREATE TRIGGER neworder 
    ->        AFTER INSERT 
    ->        ON orders
    ->        FOR EACH ROW 
    ->        SELECT NEW.order_num;
ERROR 1415 (0A000): Not allowed to return a result set from a trigger   // 在新版的mysql中这一句是错误的。也就是说在创建触发器语句中不能有select子句。

BEFORE或AFTER?:通常,将BEFORE用于数据验证和净化(目的是保证插入表中的数据确实是需要的数据)。本提示也适用于UPDATE触发器。

25.4.2 DELETE触发器

DELETE触发器在DELETE语句执行之前或之后执行。需要知道以下两
点:
 在DELETE触发器代码内,你可以引用一个名为OLD的虚拟表,访问被删除的行;
 OLD中的值全都是只读的,不能更新。

下面的例子演示使用OLD保存将要被删除的行到一个存档表中:

mysql> DELIMITER //
mysql> CREATE TRIGGER deleteorder
    ->        BEFORE DELETE
    ->        ON orders
    ->        FOR EACH ROW
    ->        BEGIN
    ->            INSERT INTO archive_orders(order_num, order_date, cust_id)
    ->            VALUES(OLD.order_num, OLD.order_date, OLD.cust_id);
    ->        END //
Query OK, 0 rows affected (0.08 sec)

mysql> DELIMITER ;

在任意订单被删除前将执行此触发器。它使用一条INSERT语句将OLD中的值(要被删除的订单)保存到一个名为archive_orders的存档表中。

使用BEFORE DELETE触发器的优点(相对于AFTER DELETE触发器来说)为,如果由于某种原因,订单不能存档, DELETE本身将被放弃。

使用BEGIN END块的好处是触发器能容纳多条SQL语句(在BEGIN END块中一条挨着一条)。

25.4.3 UPDATE触发器

UPDATE触发器在UPDATE语句执行之前或之后执行。需要知道以下几点:
 在UPDATE触发器代码中,你可以引用一个名为OLD的虚拟表访问以前( UPDATE语句前)的值,引用一个名为NEW的虚拟表访问新更新的值;
 在BEFORE UPDATE触发器中, NEW中的值可能也被更新(允许更改将要用于UPDATE语句中的值);
 OLD中的值全都是只读的,不能更新。

下面的例子保证州名缩写总是大写(不管UPDATE语句中给出的是大写还是小写):

mysql> CREATE TRIGGER updatevendor 
    ->        BEFORE UPDATE
    ->        ON vendors
    ->        FOR EACH ROW
    ->        SET NEW.vend_state = Upper(NEW.vend_state);
Query OK, 0 rows affected (0.07 sec)

每次更新一个行时, NEW.vend_state中的值(将用来更新表行的值)都用Upper(NEW.vend_state)替换。

25.4.4 关于触发器的进一步介绍

在结束本章之前,我们再介绍一些使用触发器时需要记住的重点。
 与其他DBMS相比, MySQL 5中支持的触发器相当初级。未来的MySQL版本中有一些改进和增强触发器支持的计划。
 创建触发器可能需要特殊的安全访问权限,但是,触发器的执行是自动的。如果INSERT、 UPDATE或DELETE语句能够执行,则相关的触发器也能执行。
 应该用触发器来保证数据的一致性(大小写、格式等)。在触发器中执行这种类型的处理的优点是它总是进行这种处理,而且是透明地进行,与客户机应用无关。
 触发器的一种非常有意义的使用是创建审计跟踪。使用触发器,把更改(如果需要,甚至还有之前和之后的状态)记录到另一个表非常容易。
 遗憾的是, MySQL触发器中不支持CALL语句。这表示不能从触发器内调用存储过程。所需的存储过程代码需要复制到触发器内。

第二十六章 管理事务处理

26.1 事务处理

并非所有引擎都支持事务处理 :MyISAM和InnoDB是两种最常使用的引擎。前者不支持明确的事务处理管理,而后者支持。

事务处理( transaction processing)可以用来维护数据库的完整性,它保证成批的MySQL操作要么完全执行,要么完全不执行。

事务处理是一种 机制,用来管理必须成批执行的MySQL操作,以保证数据库不包含不完 整的操作结果。利用事务处理,可以保证一组操作不会中途停止,它们 或者作为整体执行,或者完全不执行(除非明确指示)。如果没有错误发 生,整组语句提交给(写到)数据库表。如果发生错误,则进行回退(撤 销)以恢复数据库到某个已知且安全的状态。

下面是关于 事务处理需要知道的几个术语:

 事务(transaction)指一组SQL语句;
 回退(rollback)指撤销指定SQL语句的过程;
 提交(commit)指将未存储的SQL语句结果写入数据库表;
 保留点(savepoint)指事务处理中设置的临时占位符(place-holder),你可以对它发布回退(与回退整个事务处理不同)。

26.2 控制事务处理

管理事务处理的关键在于将SQL语句组分解为逻辑块,并明确规定数 据何时应该回退,何时不应该回退。

MySQL使用下面的语句来标识事务的开始:

mysql> START TRANCACTION

26.2.1 使用ROLLBACK

MySQL的ROLLBACK命令用来回退(撤销)MySQL语句,请看下面的语句:

mysql> SELECT * FROM ordertotals;
    -> START TRANSACTION;
    -> DELETE FROM ordertotals;
    -> SELECT * FROM ordertotals;
    -> ROLLBACK;
    -> SELECT * FROM ordertotals;
    -> //
+-----------+---------+
| order_num | total   |
+-----------+---------+
|     20005 |  158.86 |
|     20009 |   40.78 |
|     20006 |   58.30 |
|     20007 | 1060.00 |
|     20008 |  132.50 |
|     20008 |  132.50 |
+-----------+---------+
6 rows in set (0.00 sec)

Query OK, 0 rows affected (0.00 sec)

Query OK, 6 rows affected (0.00 sec)

Empty set (0.00 sec)

Query OK, 0 rows affected (0.11 sec)

+-----------+---------+
| order_num | total   |
+-----------+---------+
|     20005 |  158.86 |
|     20009 |   40.78 |
|     20006 |   58.30 |
|     20007 | 1060.00 |
|     20008 |  132.50 |
|     20008 |  132.50 |
+-----------+---------+
6 rows in set (0.11 sec)

显然,ROLLBACK只能在一个事务处理内使用(在执行一条START TRANSACTION命令之后)。

哪些语句可以回退? 事务处理用来管理INSERT、UPDATE和 DELETE语句。你不能回退SELECT语句。(这样做也没有什么意 义。)你不能回退CREATE或DROP操作。事务处理块中可以使用这两条语句,但如果你执行回退,它们不会被撤销。

26.2.2 使用COMMIT

一般的MySQL语句都是直接针对数据库表执行和编写的。这就是 所谓的隐含提交(implicit commit),即提交(写或保存)操作是自动 进行的。但是,在事务处理块中,提交不会隐含地进行。

为进行明确的提交, 使用COMMIT语句,如下所示:

mysql> DELIMITER //
mysql> START TRANSACTION;
    -> DELETE FROM orderitems WHERE order_num=20010;
    -> DELETE FROM orders WHERE order_num=20010;
    -> COMMIT;
    -> //
Query OK, 0 rows affected (0.00 sec)

Query OK, 0 rows affected (0.00 sec)

Query OK, 0 rows affected (0.00 sec)

Query OK, 0 rows affected (0.00 sec)

mysql> DELIMITER ;

使用事务处理块来保证订单不被部分删除。最后的COMMIT语句仅在不出错时写出更改。如果第一条DELETE起作用,但第二条失败,则DELETE不会提交(实际上,它是被自动撤销的)。

隐含事务关闭 当COMMIT或ROLLBACK语句执行后,事务会自动关闭(将来的更改会隐含提交)。

26.2.3 使用保留点

复杂的事务处理可能需要部分提交或回退。 为了支持回退部分事务处理,必须能在事务处理块中合适的位置放置占位符。这样,如果需要回退,可以回退到某个占位符。

这些占位符称为保留点。为了创建占位符,可如下使用SAVEPOINT语句:

mysql> SAVEPOINT delete1;

每个保留点都取标识它的唯一名字,以便在回退时, MySQL知道要回退到何处。为了回退到本例给出的保留点,可如下进行:

mysql> ROLLBACK TO delete1;

释放保留点:保留点在事务处理完成(执行一条ROLLBACK或COMMIT)后自动释放。自MySQL 5以来,也可以用RELEASE SAVEPOINT明确地释放保留点。

26.2.4 更改默认的提交行为

默认的MySQL行为是自动提交所有更改。MySql语句都是针对表执行的,而且所做的更改立即生效。为指示MySQL不自动提交更改,需要使用以下语句:

 mysql> SET autocommit=0;

autocommit标志决定是否自动提交更改,不管有没有COMMIT语句。设置autocommit为0(假)指示MySQL不自动提交更改(直到autocommit被设置为真为止)。

标志为连接专用:autocommit标志是针对每个连接而不是服务器的。也就是说在一个连接中改变autocommit并不会改变另外一个连接。

第二十七章  全球化和本地化

27.1 字符集和校对顺序

 

MySQL需要适应不同的字符集(不同的字母和字符),适应不同的排序和检索数据的方法。

在讨论多种语言和字符集时,将会遇到以下重要术语:
 字符集为字母和符号的集合;
 编码为某个字符集成员的内部表示;
 校对为规定字符如何比较的指令。

在MySQL的正常数据库活动( SELECT、 INSERT等)中,不需要操心太多的东西。使用何种字符集和校对的决定在服务器、数据库和表级进行。

27.2 使用字符集和校对顺序

查看所支持的字符集完整列表(这条语句显示所有可用的字符集以及每个字符集的描述和默认校对):

 mysql> SHOW CHARACTER set;
+----------+---------------------------------+---------------------+--------+
| Charset  | Description                     | Default collation   | Maxlen |
+----------+---------------------------------+---------------------+--------+
| big5     | Big5 Traditional Chinese        | big5_chinese_ci     |      2 |
| dec8     | DEC West European               | dec8_swedish_ci     |      1 |
| cp850    | DOS West European               | cp850_general_ci    |      1 |
| hp8      | HP West European                | hp8_english_ci      |      1 |
| koi8r    | KOI8-R Relcom Russian           | koi8r_general_ci    |      1 |
| latin1   | cp1252 West European            | latin1_swedish_ci   |      1 |
| latin2   | ISO 8859-2 Central European     | latin2_general_ci   |      1 |
。。。。。。。。

查看所支持校对的完整列表(此语句显示所有可用的校对,以及它们适用的字符集。):

 mysql> SHOW COLLATION;
+--------------------------+----------+-----+---------+----------+---------+
| Collation                | Charset  | Id  | Default | Compiled | Sortlen |
+--------------------------+----------+-----+---------+----------+---------+
| big5_chinese_ci          | big5     |   1 | Yes     | Yes      |       1 |
| big5_bin                 | big5     |  84 |         | Yes      |       1 |
| dec8_swedish_ci          | dec8     |   3 | Yes     | Yes      |       1 |
| dec8_bin                 | dec8     |  69 |         | Yes      |       1 |
| cp850_general_ci         | cp850    |   4 | Yes     | Yes      |       1 |
| cp850_bin                | cp850    |  80 |         | Yes      |       1 |
| hp8_english_ci           | hp8      |   6 | Yes     | Yes      |       1 |
| hp8_bin                  | hp8      |  72 |         | Yes      |       1 |
| koi8r_general_ci         | koi8r    |   7 | Yes     | Yes      |       1 |
| koi8r_bin                | koi8r    |  74 |         | Yes      |       1 |
。。。。。。。。

通常系统管理在安装时定义一个默认的字符集和校对。此外,也可以在创建数据库时,指定默认的字符集和校对。为了确定所用的字符集和校对,可以使用以下语句:

mysql> SHOW VARIABLES LIKE 'character%';
+--------------------------+----------------------------+
| Variable_name            | Value                      |
+--------------------------+----------------------------+
| character_set_client     | utf8                       |
| character_set_connection | utf8                       |
| character_set_database   | latin1                     |
| character_set_filesystem | binary                     |
| character_set_results    | utf8                       |
| character_set_server     | latin1                     |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)
 mysql> SHOW VARIABLES LIKE 'collation%';
+----------------------+-------------------+
| Variable_name        | Value             |
+----------------------+-------------------+
| collation_connection | utf8_general_ci   |
| collation_database   | latin1_swedish_ci |
| collation_server     | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.00 sec)

实际上,字符集很少是服务器范围(甚至数据库范围)的设置。不同的表,甚至不同的列都可能需要不同的字符集,而且两者都可以在创建表时指定。

为了给表指定字符集和校对,可使用带子句的CREATE TABLE:

mysql> CREATE TABLE mytable
    -> (
    ->  columnn1 INT,
    ->  columnn2 VARCHAR(10)
    -> )DEFAULT CHARACTER SET hebrew
    ->  COLLATE hebrew_general_ci;
Query OK, 0 rows affected (0.24 sec)

此语句创建一个包含两列的表,并且指定一个字符集和一个校对顺序。

如果只指定CHARACTER SET,则使用此字符集及其默认的校对(如SHOW CHARACTER SET的结果中所示)。

除了能指定字符集和校对的表范围外, MySQL还允许对每个列设置它们,如下所示:

mysql> CREATE TABLE mytable
    -> (
    ->  columnn1 INT,
    ->  columnn2 VARCHAR(10),
    ->  columnn3 VARCHAR(10) CHARACTER SET latin1 COLLATE latin1_general_ci
    -> )DEFAULT CHARACTER SET hebrew
    ->  COLLATE hebrew_general_ci;
Query OK, 0 rows affected (0.24 sec)

这里对整个表以及一个特定的列指定了CHARACTER SET和COLLATE。

如果你需要用与创建表时不同的校对顺序排序特定的SELECT语句,可以在SELECT语句自身中进行:

mysql> SELECT cust_name,cust_address FROM customers     
    ->     ORDER BY cust_name, cust_address  COLLATE latin1_general_cs;
+----------------+---------------------+
| cust_name      | cust_address        |
+----------------+---------------------+
| Coyote Inc.    | 200 Maple Lane      |
| E Fudd         | 4545 53rd Street    |
| Mouse House    | 333 Fromage Lane    |
| Wascals        | 1 Sunny Place       |
| Yosemite Place | 829 Riverside Drive |
+----------------+---------------------+
5 rows in set (0.00 sec)

此SELECT使用COLLATE指定一个备用的校对顺序。

临时区分大小写:上面的SELECT语句演示了在通常不区分大小写的表上进行区分大小写搜索的一种技术。当然,反过来也是可以的。

SELECT的其他COLLATE子句:除了这里看到的在ORDER BY子句中使用以外, COLLATE还可以用于GROUP BY、 HAVING、聚集函数、别名等。

如果绝对需要,串可以在字符集之间进行转换。为此,使用Cast()或Convert()函数。

第二十八章  安 全 管 理

28.1 访问控制

MySQL服务器的安全基础是: 用户应该对他们需要的数据具有适当的访问权,既不能多也不能少。

应该创建一系列的账号,有的用于管理,有的供用户使用,有的供开发人员使用,等等。
防止无意的错误:重要的是注意到,访问控制的目的不仅仅是防止用户的恶意企图。数据梦魇更为常见的是无意识错误的结果,如错打MySQL语句,在不合适的数据库中操作或其他一些用户错误。通过保证用户不能执行他们不应该执行的语句,访问控制有助于避免这些情况的发生。
不要使用root:应该严肃对待root登录的使用。仅在绝对需要时使用它(或许在你不能登录其他管理账号时使用)。不应该在日常的MySQL操作中使用root。

28.2 管理用户

获得所有用户账号列表:

mysql> use mysql
Database changed
mysql> SELECT user FROM user;
+------------------+
| user             |
+------------------+
| learning         |
| mobile           |
| debian-sys-maint |
| mysql.sys        |
| root             |
+------------------+
5 rows in set (0.00 sec)

28.2.1 创建用户账号

为了创建一个新用户账号,使用CREATE USER语句:

mysql> CREATE USER yhw IDENTIFIED BY '654321';
Query OK, 0 rows affected (0.02 sec)

在创建用户账号时不一定需要口令,不过这个例子用IDENTIFIED BY ‘654321’给出了一个口令。

指定散列口令:IDENTIFIED BY指定的口令为纯文本, MySQL将在保存到user表之前对其进行加密。为了作为散列值指定口令,使用IDENTIFIED BY PASSWORD。

使用GRANT或INSERT:GRANT语句(稍后介绍)也可以创建用户账号,但一般来说CREATE USER是最清楚和最简单的句子。此外, 也可以通过直接插入行到user表来增加用户, 不过为安
全起见,一般不建议这样做。 MySQL用来存储用户账号信息的表(以及表模式等)极为重要,对它们的任何毁坏都可能严重地伤害到MySQL服务器。因此,相对于直接处理来说,最好是用标记和函数来处理这些表。

为重新命名一个用户账号,使用RENAME USER语句,如下所示:

mysql> RENAME USER yhw TO yhwyhw;
Query OK, 0 rows affected (0.00 sec)

28.2.2 删除用户账号

为了删除一个用户账号(以及相关的权限),使用DROP USER语句:

mysql> DROP USER yhwyhw;
Query OK, 0 rows affected (0.00 sec)

自MySQL 5以来, DROP USER删除用户账号和所有相关的账号权限。

28.2.3 设置访问权限

在创建用户账号后,必须接着分配访问权限。新创建的用户账号没有访问权限。它们能登录MySQL,但不能看到数据,不能执行任何数据库操作。

为看到赋予用户账号的权限,使用SHOW GRANTS FOR,如下所示:

mysql> SHOW GRANTS FOR learning;
+--------------------------------------------------------------------------+
| Grants for learning@%                                                    |
+--------------------------------------------------------------------------+
| GRANT USAGE ON *.* TO 'learning'@'%'                                     |
+--------------------------------------------------------------------------+
2 rows in set (0.00 sec)

USAGE表示根本没有权限(我知道,这不很直观),所以,此结果表示在任意数据库和任意表上对任何东西没有权限。

用户定义为user@host MySQL的权限用用户名和主机名结合定义。

以下例子给出GRANT的用法:

mysql> GRANT SELECT ON learning.* TO bforta;
Query OK, 0 rows affected (0.00 sec)

SHOW GRANTS反映这个更改:

mysql> SHOW GRANTS FOR bforta;
+----------------------------------------------+
| Grants for bforta@%                          |
+----------------------------------------------+
| GRANT USAGE ON *.* TO 'bforta'@'%'           |
| GRANT SELECT ON `learning`.* TO 'bforta'@'%' |
+----------------------------------------------+
2 rows in set (0.00 sec)

GRANT的反操作为REVOKE,用它来撤销特定的权限。下面举一个例子:

mysql> REVOKE SELECT ON learning.* FROM bforta;
Query OK, 0 rows affected (0.00 sec)

被撤销的访问权限必须存在,否则会出错。

GRANT和REVOKE可在几个层次上控制访问权限:
 整个服务器,使用GRANT ALL和REVOKE ALL;
 整个数据库,使用ON database.*;
 特定的表,使用ON database.table;
 特定的列;
 特定的存储过程。

下表列出可以授予或撤销的每个权限。

权限 权限级别 权限说明
CREATE 数据库、表或索引 创建数据库、表或索引权限
DROP 数据库或表 删除数据库或表权限
GRANT OPTION 数据库、表或保存的程序 赋予权限选项
REFERENCES 数据库或表
ALTER 更改表,比如添加字段、索引等
DELETE 删除数据权限
INDEX 索引权限
INSERT 插入权限
SELECT 查询权限
UPDATE 更新权限
CREATE VIEW 视图 创建视图权限
SHOW VIEW 视图 查看视图权限
ALTER ROUTINE 存储过程 更改存储过程权限
CREATE ROUTINE 存储过程 创建存储过程权限
EXECUTE 存储过程 执行存储过程权限
FILE 服务器主机上的文件访问 文件访问权限
CREATE TEMPORARY TABLES 服务器管理 创建临时表权限
LOCK TABLES 服务器管理 锁表权限
CREATE USER 服务器管理 创建用户权限
PROCESS 服务器管理 查看进程权限
RELOAD 服务器管理 执行flush-hosts, flush-logs, flush-privileges, flush-status, flush-tables, flush-threads, refresh, reload等命令的权限
REPLICATION CLIENT 服务器管理 复制权限
REPLICATION SLAVE 服务器管理 复制权限
SHOW DATABASES 服务器管理 查看数据库权限
SHUTDOWN 服务器管理 关闭数据库权限
SUPER 服务器管理 执行kill线程权限

简化多次授权:可通过列出各权限并用逗号分隔,将多条GRANT语句串在一起,如下所示:

mysql> GRANT SELECT,INSERT ON learning.* TO bforta;
Query OK, 0 rows affected (0.00 sec)

28.2.4 更改口令

可使用SET PASSWORD语句。新口令必须如下加密:

mysql> SET PASSWORD FOR bforta=Password('654321');
Query OK, 0 rows affected, 1 warning (0.00 sec)

SET PASSWORD还可以用来设置你自己的口令:

mysql> SET PASSWORD=Password('654321');

在不指定用户名时, SET PASSWORD更新当前登录用户的口令。

第二十九章  数据库维护

29.1 备份数据

由于MySQL数据 库是基于磁盘的文件,普通的备份系统和例程就能备份MySQL的数据。 但是,由于这些文件总是处于打开和使用状态,普通的文件副本备份不 一定总是有效。(是一种思路)

 使用命令行实用程序mysqldump转储所有数据库内容到某个外部文件。在进行常规备份前这个实用程序应该正常运行,以便能正 确地备份转储文件。

 可用命令行实用程序mysqlhotcopy从一个数据库复制所有数据 (并非所有数据库引擎都支持这个实用程序)。

 可以使用MySQL的BACKUP TABLE或SELECT INTO OUTFILE转储所有数据到某个外部文件。这两条语句都接受将要创建的系统文件 名,此系统文件必须不存在,否则会出错。数据可以用RESTORE TABLE来复原。

首先刷新未写数据:为了保证所有数据被写到磁盘(包括索引 数据),可能需要在进行备份前使用FLUSH TABLES语句。

29.2 进行数据库维护

 ANALYZE TABLE,用来检查表键是否正确。ANALYZE TABLE返回如 下所示的状态信息:

mysql> ANALYZE TABLE orders;
+-----------------+---------+----------+----------+
| Table           | Op      | Msg_type | Msg_text |
+-----------------+---------+----------+----------+
| learning.orders | analyze | status   | OK       |
+-----------------+---------+----------+----------+
1 row in set (0.00 sec)

 CHECK TABLE用来针对许多问题对表进行检查。在MyISAM表上还对 索引进行检查。CHECK TABLE支持一系列的用于MyISAM表的方式。 CHANGED检查自最后一次检查以来改动过的表。EXTENDED执行最 彻底的检查,FAST只检查未正常关闭的表,MEDIUM检查所有被删 除的链接并进行键检验,QUICK只进行快速扫描。如下所示,CHECK TABLE发现和修复问题:

mysql> CHECK TABLE orders, orderitems;
+---------------------+-------+----------+----------+
| Table               | Op    | Msg_type | Msg_text |
+---------------------+-------+----------+----------+
| learning.orders     | check | status   | OK       |
| learning.orderitems | check | status   | OK       |
+---------------------+-------+----------+----------+
2 rows in set (0.00 sec)

 如果MyISAM表访问产生不正确和不一致的结果,可能需要用 REPAIR TABLE来修复相应的表。这条语句不应该经常使用,如果 需要经常使用,可能会有更大的问题要解决。

 如果从一个表中删除大量数据,应该使用OPTIMIZE TABLE来收回所用的空间,从而优化表的性能。

29.3 诊断启动问题

服务器启动问题通常在对MySQL配置或服务器本身进行更改时出 现。MySQL在这个问题发生时报告错误,但由于多数MySQL服务器是作 为系统进程或服务自动启动的,这些消息可能看不到。

在排除系统启动问题时,首先应该尽量用手动启动服务器。MySQL 服务器自身通过在命令行上执行mysqld启动。下面是几个重要的mysqld 命令行选项:

 –help显示帮助——一个选项列表;
 –safe-mode装载减去某些最佳配置的服务器;
 –verbose显示全文本消息(为获得更详细的帮助消息与–help联合使用);
 –version显示版本信息然后退出。

29.4 查看日志文件

MySQL维护管理员依赖的一系列日志文件。主要的日志文件有以下几种。

  错误日志。它包含启动和关闭问题以及任意关键错误的细节。此 日志通常名为hostname.err,位于data目录中。此日志名可用 –log-error命令行选项更改。

  查询日志。它记录所有MySQL活动,在诊断问题时非常有用。此 日志文件可能会很快地变得非常大,因此不应该长期使用它。此 日志通常名为hostname.log,位于data目录中。此名字可以用 –log命令行选项更改。

  二进制日志。它记录更新过数据(或者可能更新过数据)的所有 语句。此日志通常名为hostname-bin,位于data目录内。此名字 可以用–log-bin命令行选项更改。注意,这个日志文件是MySQL5中添加的,以前的MySQL版本中使用的是更新日志。

 缓慢查询日志。顾名思义,此日志记录执行缓慢的任何查询。这 个日志在确定数据库何处需要优化很有用。此日志通常名为 hostname-slow.log,位于data目录中。此名字可以用–log-slow-queries命令行选项更改。

在使用日志时,可用FLUSH LOGS语句来刷新和重新开始所有日志文件。

第三十章 改 善 性 能

30.1 改善性能

 首先, MySQL(与所有DBMS一样)具有特定的硬件建议。在学习和研究MySQL时,使用任何旧的计算机作为服务器都可以。但对用于生产的服务器来说,应该坚持遵循这些硬件建议。
 一般来说,关键的生产DBMS应该运行在自己的专用服务器上。
 MySQL是用一系列的默认设置预先配置的,从这些设置开始通常是很好的。但过一段时间后你可能需要调整内存分配、缓冲区大小等。(为查看当前设置,可使用 SHOW VARIABLES;和 SHOW
STATUS;。)
 MySQL一个多用户多线程的DBMS,换言之,它经常同时执行多个任务。如果这些任务中的某一个执行缓慢,则所有请求都会执行缓慢。如果你遇到显著的性能不良,可使用SHOW PROCESSLIST显示所有活动进程(以及它们的线程ID和执行时间)。你还可以用 KILL命令终结某个特定的进程(使用这个命令需要作为管理员登录)。
 总是有不止一种方法编写同一条SELECT语句。 应该试验联结、并、子查询等,找出最佳的方法。
 使用EXPLAIN语句让MySQL解释它将如何执行一条SELECT语句。
 一般来说,存储过程执行得比一条一条地执行其中的各条MySQL语句快。
 应该总是使用正确的数据类型。
 决不要检索比需求还要多的数据。换言之,不要用SELECT *(除非你真正需要每个列)。
 有的操作(包括INSERT)支持一个可选的DELAYED关键字,如果使用它,将把控制立即返回给调用程序,并且一旦有可能就实际执行该操作。
 在导入数据时,应该关闭自动提交。你可能还想删除索引(包括FULLTEXT索引),然后在导入完成后再重建它们。
 必须索引数据库表以改善数据检索的性能。确定索引什么不是一件微不足道的任务,需要分析使用的SELECT语句以找出重复的WHERE和ORDER BY子句。如果一个简单的WHERE子句返回结果所花的时间太长,则可以断定其中使用的列(或几个列)就是需要索引的对象。
 你的SELECT语句中有一系列复杂的OR条件吗?通过使用多条SELECT语句和连接它们的UNION语句,你能看到极大的性能改进。
 索引改善数据检索的性能,但损害数据插入、删除和更新的性能。如果你有一些表,它们收集数据且不经常被搜索,则在有必要之前不要索引它们。(索引可根据需要添加和删除。)
 LIKE很慢。一般来说,最好是使用FULLTEXT而不是LIKE。
 数据库是不断变化的实体。一组优化良好的表一会儿后可能就面目全非了。由于表的使用和内容的更改,理想的优化和配置也会改变。
 最重要的规则就是,每条规则在某些条件下都会被打破。

每天进步一点点之Mysql数据简明使用教程【转】

1、启动MySQL服务器
实际上上篇已讲到如何启动MySQL。两种方法:
一是用winmysqladmin,如果机器启动时已自动运行,则可直接进入下一步操作。
二是在DOS方式下运行
d:/mysql/bin/mysqld

2、进入mysql交互操作界面
在DOS方式下,运行:
d:/mysql/bin/mysql -u root -p
出现提示符,此时已进入mysql的交互操作方式。
如果出现 “ERROR 2003: Can‘t connect to MySQL server on ‘localhost‘ (10061)“,说明你的MySQL还没有启动。

3、退出MySQL操作界面
在mysql>提示符下输入quit可以随时退出交互操作界面:
mysql> quit
Bye
你也可以用control-D退出。

4、第一条命令
mysql> select version(),current_date();
+—————-+—————–+
| version()   | current_date() |
+—————-+—————–+
| 3.23.25a-debug | 2001-05-17   |
+—————-+—————–+
1 row in set (0.01 sec)

此命令要求mysql服务器告诉你它的版本号和当前日期。尝试用不同大小写操作上述命令,看结果如何。
结果说明mysql命令的大小写结果是一致的。
练习如下操作:
mysql>Select (20+5)*4;
mysql>Select (20+5)*4,sin(pi()/3);
mysql>Select (20+5)*4 AS Result,sin(pi()/3); (AS: 指定假名为Result)

5、多行语句
一条命令可以分成多行输入,直到出现分号“;”为止:
mysql> select
-> USER()
-> ,
-> now()
->;
+——————–+—————————–+
| USER()               | now()                           |
+——————–+—————————–+
| ODBC@localhost| 2001-05-17 22:59:15  |
+——————–+—————————–+

6、使用SHOW语句找出在服务器上当前存在什么数据库:

mysql> SHOW DATABASES;
+———-+
| Database |
+———-+
| mysql  |
| test   |
+———-+
3 rows in set (0.00 sec)

7、创建一个数据库abccs
mysql> CREATE DATABASE abccs;
注意不同操作系统对大小写的敏感。

8、选择你所创建的数据库
mysql> USE abccs
Database changed
此时你已经进入你刚才所建立的数据库abccs.

9 创建一个数据库表
首先看现在你的数据库中存在什么表:
mysql> SHOW TABLES;
Empty set (0.00 sec)
说明刚才建立的数据库中还没有数据库表。下面来创建一个数据库表mytable:

我们要建立一个你公司员工的生日表,表的内容包含员工姓名、性别、出生日期、出生城市。
mysql> CREATE TABLE mytable (name VARCHAR(20), sex CHAR(1),
-> birth DATE, birthaddr VARCHAR(20));
Query OK, 0 rows affected (0.00 sec)

由于name、birthadd的列值是变化的,因此选择VARCHAR,其长度不一定是20。可以选择从1到255的任何长度,如果以后需要改变它的字长,可以使用ALTER TABLE语句。);
性别只需一个字符就可以表示:”m”或”f”,因此选用CHAR(1);birth列则使用DATE数据类型。

创建了一个表后,我们可以看看刚才做的结果,用SHOW TABLES显示数据库中有哪些表:
mysql> SHOW TABLES;
+———————+
| Tables in menagerie |
+———————+
| mytables      |
+———————+

10、显示表的结构:
mysql> DESCRIBE mytable;
+————-+————-+——+—–+———+——-+
| Field    | Type    | Null | Key | Default | Extra |
+————-+————-+——+—–+———+——-+
| name    | varchar(20) | YES |   | NULL  |    |
| sex     | char(1)   | YES |   | NULL  |    |
| birth    | date    | YES |   | NULL  |    |
| deathaddr  | varchar(20) | YES |   | NULL  |    |
+————-+————-+——+—–+———+——-+

11、查询所有数据:
mysql> select * from mytable;
+———-+——+————+———-+
| name   | sex | birth   | birthaddr |
+———-+——+————+——–+
| abccs  |f  | 1977-07-07 | china   |
| mary   |f  | 1978-12-12 | usa    |
| tom   |m  | 1970-09-02 | usa    |
+———-+——+————+———-+
3 row in set (0.00 sec)

12、修正错误记录:
假如tom的出生日期有错误,应该是1973-09-02,则可以用update语句来修正:
mysql> update mytable set birth = “1973-09-02” where name = “tom”;
再用2中的语句看看是否已更正过来。

13、选择特定行
上面修改了tom的出生日期,我们可以选择tom这一行来看看是否已经有了变化:
mysql> select * from mytable where name = “tom”;
+——–+——+————+————+
| name  |sex | birth   | birthaddr     |
+——–+——+————+————+
| tom  |m  | 1973-09-02 | usa    |
+——–+——+————+————+
1 row in set (0.06 sec)

上面WHERE的参数指定了检索条件。我们还可以用组合条件来进行查询:
mysql> SELECT * FROM mytable WHERE sex = “f” AND birthaddr = “china”;
+——–+——+————+————+
| name  |sex | birth   | birthaddr     |
+——–+——+————+————+
| abccs |f  | 1977-07-07 | china   |
+——–+——+————+————+
1 row in set (0.06 sec)

14 多表操作

前面我们熟悉了数据库和数据库表的基本操作,现在我们再来看看如何操作多个表。

在一个数据库中,可能存在多个表,这些表都是相互关联的。我们继续使用前面的例子。前面建立的表中包含了员工的一些基本信息,如姓名、性别、出生日期、出生地。我们再创建一个表,该表用于描述员工所发表的文章,内容包括作者姓名、文章标题、发表日期。

1、查看第一个表mytable的内容:
mysql> select * from mytable;
+———-+——+————+———–+
| name   | sex | birth   | birthaddr |
+———-+——+————+———–+
| abccs  |f   | 1977-07-07 | china   |
| mary   |f   | 1978-12-12 | usa    |
| tom   |m   | 1970-09-02 | usa    |
+———-+——+————+———–+

2、创建第二个表title(包括作者、文章标题、发表日期):
mysql> create table title(writer varchar(20) not null,
-> title varchar(40) not null,
-> senddate date);

向该表中填加记录,最后表的内容如下:
mysql> select * from title;
+——–+——-+————+
| writer | title | senddate  |
+——–+——-+————+
| abccs | a1  | 2000-01-23 |
| mary  | b1  | 1998-03-21 |
| abccs | a2  | 2000-12-04 |
| tom  | c1  | 1992-05-16 |
| tom  | c2  | 1999-12-12 |
+——–+——-+————+
5 rows in set (0.00sec)

3、多表查询
现在我们有了两个表: mytable 和 title。利用这两个表我们可以进行组合查询:
例如我们要查询作者abccs的姓名、性别、文章:
mysql> SELECT name,sex,title FROM mytable,title
-> WHERE name=writer AND name=‘abccs‘;
+——-+——+——-+
| name | sex | title |
+——-+——+——-+
| abccs | f  | a1  |
| abccs | f  | a2  |
+——-+——+——-+

上面例子中,由于作者姓名、性别、文章记录在两个不同表内,因此必须使用组合来进行查询。必须要指定一个表中的记录如何与其它表中的记录进行匹配。

注意:如果第二个表title中的writer列也取名为name(与mytable表中的name列相同)而不是writer时,就必须用mytable.name和title.name表示,以示区别。

再举一个例子,用于查询文章a2的作者、出生地和出生日期:
mysql> select title,writer,birthaddr,birth from mytable,title
-> where mytable.name=title.writer and title=‘a2‘;
+——-+——–+———–+————+
| title | writer | birthaddr | birth   |
+——-+——–+———–+————+
| a2  | abccs | china   | 1977-07-07 |
+——-+——–+———–+————+

15、增加一列:
如在前面例子中的mytable表中增加一列表示是否单身single:
mysql> alter table mytable add column single char(1);

16、修改记录
将abccs的single记录修改为“y”:
mysql> update mytable set single=‘y‘ where name=‘abccs‘;

现在来看看发生了什么:
mysql> select * from mytable;
+———-+——+————+———–+——–+
| name   | sex | birth   | birthaddr | single |
+———-+——+————+———–+——–+
| abccs  |f   | 1977-07-07 | china   | y   |
| mary   |f   | 1978-12-12 | usa    | NULL  |
| tom   |m   | 1970-09-02 | usa    | NULL  |
+———-+——+————+———–+——–+

17、增加记录
前面已经讲过如何增加一条记录,为便于查看,重复与此:
mysql> insert into mytable
-> values (‘abc‘,‘f‘,‘1966-08-17‘,‘china‘,‘n‘);
Query OK, 1 row affected (0.05 sec)
查看一下:
mysql> select * from mytable;
+———-+——+————+———–+——–+
| name   | sex | birth   | birthaddr | single |
+———-+——+————+———–+——–+
| abccs  |f   | 1977-07-07 | china   | y   |
| mary   |f   | 1978-12-12 | usa    | NULL  |
| tom   |m   | 1970-09-02 | usa    | NULL  |
| abc   |f   | 1966-08-17 | china   | n   |
+———-+——+————+———–+——–+

18、删除记录
用如下命令删除表中的一条记录:
mysql> delete from mytable where name=‘abc‘;
DELETE从表中删除满足由where给出的条件的一条记录。

再显示一下结果:
mysql> select * from mytable;
+———-+——+————+———–+——–+
| name   | sex | birth   | birthaddr | single |
+———-+——+————+———–+——–+
| abccs  |f   | 1977-07-07 | china   | y   |
| mary   |f   | 1978-12-12 | usa    | NULL  |
| tom   |m   | 1970-09-02 | usa    | NULL  |
+———-+——+————+———–+——–+

19、删除表:
mysql> drop table ****(表1的名字),***表2的名字;
可以删除一个或多个表,小心使用。

20、数据库的删除:
mysql> drop database 数据库名;
小心使用。

21、数据库的备份:
退回到DOS:
mysql> quit
d:mysqlbin
使用如下命令对数据库abccs进行备份:
mysqldump –opt abccs>abccs.dbb
abccs.dbb就是你的数据库abccs的备份文件。

22、用批处理方式使用MySQL:

首先建立一个批处理文件mytest.sql,内容如下:
use abccs;
select * from mytable;
select name,sex from mytable where name=‘abccs‘;

在DOS下运行如下命令:
d:mysqlbin mysql < mytest.sql
在屏幕上会显示执行结果。

如果想看结果,而输出结果很多,则可以用这样的命令:
mysql < mytest.sql | more

我们还可以将结果输出到一个文件中:
mysql < mytest.sql > mytest.out

23. 请先用root登录到mysql,方法:
c:/mysql/bin/mysql -u root -p

24.创建一个用户

mysql> GRANT ALL PRIVILEGES ON javatest.* TO javauser@”%”
->   IDENTIFIED BY “javadude” ;