day08-汇总数据

day08-汇总数据

聚集函数

我们经常需要汇总数据而不用把它们实际检索出来,为此 SQL 提供了专门的函数。使用这些函数,SQL 查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有:


 确定表中行数(或者满足某个条件或包含某个特定值的行数);
 获得表中某些行的和;
 找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。
上述例子都需要汇总出表中的数据,而不需要查出数据本身。因此,返回实际表数据纯属浪费时间和处理资源(更不用说带宽了)。再说一遍,我们实际想要的是汇总信息。

为方便这种类型的检索,SQL 给出了 5 个聚集函数


聚集函数(aggregate function) 
对某些行运行的函数,计算并返回一个值



函数 说明
AVG() 返回某列的平均值
COUNT() 返回某列的行数
MAX() 返回某列的最大值
MIN() 返回某列的最小值
SUM() 返回某列值之和

AVG()函数

SELECT AVG(prod_price) AS avg_price
FROM Products;



输出:

mysql> SELECT AVG(prod_price) AS avg_price
    -> FROM Products;
+-----------+
| avg_price |
+-----------+
|  6.823333 |
+-----------+
1 row in set (0.00 sec)

mysql> 




SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';


输出:

mysql> SELECT AVG(prod_price) AS avg_price
    -> FROM Products
    -> WHERE vend_id = 'DLL01';
+-----------+
| avg_price |
+-----------+
|  3.865000 |
+-----------+
1 row in set (0.00 sec)

mysql> 




注意:只用于单个列 
AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个 AVG()函数。只有一个例外是要从多个列计算出一个值时


说明:NULL 值 
AVG()函数忽略列值为 NULL 的行。


count()函数

COUNT()函数有两种使用方式:
 使用 COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值
(NULL)还是非空值。
 使用 COUNT(column)对特定列中具有值的行进行计数,忽略 NULL 值。


SELECT COUNT(*) AS num_cust
FROM Customers;

输出:

mysql> SELECT COUNT(*) AS num_cust
    -> FROM Customers;
+----------+
| num_cust |
+----------+
|        5 |
+----------+
1 row in set (0.00 sec)

mysql> 




SELECT COUNT(cust_email) AS num_cust
FROM Customers;


输出:
mysql> SELECT COUNT(cust_email) AS num_cust
    -> FROM Customers;
+----------+
| num_cust |
+----------+
|        3 |
+----------+
1 row in set (0.00 sec)

mysql> 



这条 SELECT 语句使用 COUNT(cust_email)对 cust_email 列中有值的行进行计数。在此例子中,cust_email 的计数为 3(表示 5 个顾客中只有 3 个顾客有电子邮件地址)。


说明:NULL 值 
如果指定列名,则 COUNT()函数会忽略指定列的值为 NULL 的行,但如果 COUNT()函数中用的是星号(*),则不忽略。




MAX()函数

SELECT MAX(prod_price) AS max_price
FROM Products;


输出:
mysql> SELECT MAX(prod_price) AS max_price
    -> FROM Products;
+-----------+
| max_price |
+-----------+
|     11.99 |
+-----------+
1 row in set (0.00 sec)

mysql> 




提示:对非数值数据使用 MAX() 
虽然 MAX()一般用来找出最大的数值或日期值,但许多(并非所有)DBMS 允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,MAX()返回按该列排序后的最后一行。

说明:NULL 值 
MAX()函数忽略列值为 NULL 的行。



MIN()函数

SELECT MIN(prod_price) AS min_price
FROM Products;




输出:
mysql> SELECT MIN(prod_price) AS min_price
    -> FROM Products;
+-----------+
| min_price |
+-----------+
|      3.49 |
+-----------+
1 row in set (0.00 sec)

mysql> 




提示:对非数值数据使用 MIN() 
虽然 MIN()一般用来找出最小的数值或日期值,但许多(并非所有)DBMS 允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,MIN()返回该列排序后最前面的行。


说明:NULL 值 
MIN()函数忽略列值为 NULL 的行。



SUM()函数

SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;



输出:
mysql> SELECT SUM(quantity) AS items_ordered
    -> FROM OrderItems
    -> WHERE order_num = 20005;
+---------------+
| items_ordered |
+---------------+
|           200 |
+---------------+
1 row in set (0.00 sec)

mysql> 



函数 SUM(quantity)返回订单中所有物品数量之和,WHERE 子句保证只统计某个物品订单中的物品。
SUM()也可以用来合计计算值。在下面的例子中,合计每项物品的item_price*quantity,得出总的订单金额:




SELECT SUM(item_price*quantity) AS total_price
FROM OrderItems
WHERE order_num = 20005;



输出:
mysql> SELECT SUM(item_price*quantity) AS total_price
    -> FROM OrderItems
    -> WHERE order_num = 20005;
+-------------+
| total_price |
+-------------+
|     1648.00 |
+-------------+
1 row in set (0.00 sec)

mysql> 



函数 SUM(item_price*quantity)返回订单中所有物品价钱之和,WHERE子句同样保证只统计某个物品订单中的物品。

提示:在多个列上进行计算 
如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。

说明:NULL 值 
SUM()函数忽略列值为 NULL 的行。

聚集不同值


以上 5 个聚集函数都可以如下使用。
 对所有行执行计算,指定 ALL 参数或不指定参数(因为 ALL 是默认行为)。
 只包含不同的值,指定 DISTINCT 参数。

提示:ALL 为默认 
ALL 参数不需要指定,因为它是默认行为。如果不指定 DISTINCT,则假定为 ALL。

下面的例子使用 AVG()函数返回特定供应商提供的产品的平均价格。它与上面的 SELECT 语句相同,但使用了 DISTINCT 参数,因此平均值只考虑各个不同的价格:





SELECT AVG(DISTINCT prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';


输出:
mysql> SELECT AVG(DISTINCT prod_price) AS avg_price
    -> FROM Products
    -> WHERE vend_id = 'DLL01';
+-----------+
| avg_price |
+-----------+
|  4.240000 |
+-----------+
1 row in set (0.00 sec)

mysql> 







可以看到,在使用了 DISTINCT 后,此例子中的 avg_price 比较高,因为有多个物品具有相同的较低价格。排除它们提升了平均价格。


注意:DISTINCT 不能用于 COUNT(*)
如果指定列名,则 DISTINCT 只能用于 COUNT()。DISTINCT 不能用于 COUNT(*)。类似地,DISTINCT 必须使用列名,不能用于计算或表达式。


提示:将 DISTINCT 用于 MIN()和 MAX()
虽然 DISTINCT 从技术上可用于 MIN()和 MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否只考虑不同值,结果都是相同的。


说明:其他聚集参数 
除了这里介绍的 DISTINCT 和 ALL 参数,有的 DBMS 还支持其他参数,如支持对查询结果的子集进行计算的 TOP 和 TOP PERCENT。为了解具体的 DBMS 支持哪些参数,请参阅相应的文档。








组合聚合函数

SELECT COUNT(*) AS num_items,
 MIN(prod_price) AS price_min,
 MAX(prod_price) AS price_max,
 AVG(prod_price) AS price_avg
FROM Products;




输出:

mysql> SELECT COUNT(*) AS num_items,
    ->  MIN(prod_price) AS price_min,
    ->  MAX(prod_price) AS price_max,
    ->  AVG(prod_price) AS price_avg
    -> FROM Products;
+-----------+-----------+-----------+-----------+
| num_items | price_min | price_max | price_avg |
+-----------+-----------+-----------+-----------+
|         9 |      3.49 |     11.99 |  6.823333 |
+-----------+-----------+-----------+-----------+
1 row in set (0.00 sec)

mysql> 






注意:取别名 
在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做也算合法,但许多 SQL 实现不支持,可能会产生模糊的错误消息。

小结

聚集函数用来汇总数据。SQL 支持 5 个聚集函数,可以用多种方法使用它们,返回所需的结果。这些函数很高效,它们返回结果一般比你在自己的客户端应用程序中计算要快得多。



小练习

1.编写 SQL 语句,确定已售出产品的总数(使用 OrderItems 中的quantity 列)。

SELECT SUM(quantity) AS items_ordered
FROM OrderItems;


输出:

mysql> SELECT SUM(quantity) AS items_ordered
    -> FROM OrderItems;
+---------------+
| items_ordered |
+---------------+
|          1430 |
+---------------+
1 row in set (0.00 sec)

mysql> 


2.修改刚刚创建的语句,确定已售出产品项(prod_item)BR01 的总数。




SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE prod_id = 'BR01';



输出:

mysql> SELECT SUM(quantity) AS items_ordered
    -> FROM OrderItems
    -> WHERE prod_id = 'BR01';
+---------------+
| items_ordered |
+---------------+
|           120 |
+---------------+
1 row in set (0.00 sec)

mysql> 



3.编写 SQL 语句,确定 Products 表中价格不超过 10 美元的最贵产品 的价格(prod_price)。将计算所得的字段命名为 max_price。

SELECT MAX(prod_price) AS max_price
FROM Products
WHERE prod_price <= 10;



输出:

mysql> SELECT MAX(prod_price) AS max_price
    -> FROM Products
    -> WHERE prod_price <= 10;
+-----------+
| max_price |
+-----------+
|      9.49 |
+-----------+
1 row in set (0.00 sec)

mysql> 




posted @ 2025-06-23 20:21  三思博客  阅读(8)  评论(0)    收藏  举报