当前位置：首页 > 前端设计 > 正文

group by数据库中什么意思，数据库order by用法

夕逆IT
前端设计
2023-08-13
86

各位老铁们好，相信很多人对group by数据库中什么意思都不是特别的了解，因此呢，今天就来为大家分享下关于group by数据库中什么意思以及数据库order by用...

各位老铁们好，相信很多人对group by数据库中什么意思都不是特别的了解，因此呢，今天就来为大家分享下关于group by数据库中什么意思以及数据库order by用法的问题知识，还望可以帮助大家，解决大家的一些困惑，下面一起来看看吧！

groupby和orderby区别

区别在于groupby的意思是“依据....分组”，orderby意思是“依据....排序”。

distinct和groupby的区别

这两者本质上应该没有可比性，distinct查询结果取出唯一列，groupby是分组，但有时候在优化的时候，在没有聚合函数的时候，他们查出来的结果也一样。

group by是返回多少条数据

数据库操作，按大小顺序进行输出，个数不确定。

数据库的group和group by的用法

在日常查询中，索引或其他数据查找的方法可能不是查询执行中最高昂的部分，例如：MySQLGROUPBY可能负责查询执行时间90%还多。MySQL执行GROUPBY时的主要复杂性是计算GROUPBY语句中的聚合函数。UDF聚合函数是一个接一个地获得构成单个组的所有值。这样，它可以在移动到另一个组之前计算单个组的聚合函数值。当然，问题在于，在大多数情况下，源数据值不会被分组。来自各种组的值在处理期间彼此跟随。因此，我们需要一个特殊的步骤。

处理MySQLGROUPBY让我们看看之前看过的同一张table：mysql>showcreatetabletblG***************************1.row***************************Table:tblCreateTable:CREATETABLE`tbl`(`id`int(11)NOTNULLAUTO_INCREMENT,`k`int(11)NOTNULLDEFAULT'0',`g`int(10)unsignedNOTNULL,PRIMARYKEY(`id`),KEY`k`(`k`))ENGINE=InnoDBAUTO_INCREMENT=2340933DEFAULTCHARSET=latin11rowinset(0.00sec)

并且以不同方式执行相同的GROUPBY语句：

1、MySQL中的IndexOrderedGROUPBY

mysql>selectk,count(*)cfromtblgroupbykorderbyklimit5;

+---+---+

|k|c|

+---+---+

|2|3|

|4|1|

|5|2|

|8|1|

|9|1|

+---+---+

5rowsinset(0.00sec)

mysql>explainselectk,count(*)cfromtblgroupbykorderbyklimit5G

***************************1.row***************************

id:1

select_type:SIMPLE

table:tbl

partitions:NULL

type:index

possible_keys:k

key:k

key_len:4

ref:NULL

rows:5

filtered:100.00

Extra:Usingindex

1rowinset,1warning(0.00sec)

在这种情况下，我们在GROUPBY的列上有一个索引。这样，我们可以逐组扫描数据并动态执行GROUPBY（低成本）。当我们使用LIMIT限制我们检索的组的数量或使用“覆盖索引”时，特别有效，因为顺序索引扫描是一种非常快速的操作。

如果您有少量组，并且没有覆盖索引，索引顺序扫描可能会导致大量IO。所以这可能不是最优化的计划。

2、MySQL中的外部排序GROUPBY

mysql>explainselectSQL_BIG_RESULTg,count(*)cfromtblgroupbyglimit5G

***************************1.row***************************

id:1

select_type:SIMPLE

table:tbl

partitions:NULL

type:ALL

possible_keys:NULL

key:NULL

key_len:NULL

ref:NULL

rows:998490

filtered:100.00

Extra:Usingfilesort

1rowinset,1warning(0.00sec)

mysql>selectSQL_BIG_RESULTg,count(*)cfromtblgroupbyglimit5;

+---+---+

|g|c|

+---+---+

|0|1|

|1|2|

|4|1|

|5|1|

|6|2|

+---+---+

5rowsinset(0.88sec)

如果我们没有允许我们按组顺序扫描数据的索引，我们可以通过外部排序（在MySQL中也称为“filesort”）来获取数据。你可能会注意到我在这里使用SQL_BIG_RESULT提示来获得这个计划。没有它，MySQL在这种情况下不会选择这个计划。

一般来说，MySQL只有在我们拥有大量组时才更喜欢使用这个计划，因为在这种情况下，排序比拥有临时表更有效（我们将在下面讨论）。

3、MySQL中的临时表GROUPBY

mysql>explainselectg,sum(g)sfromtblgroupbyglimit5G

***************************1.row***************************

id:1

select_type:SIMPLE

table:tbl

partitions:NULL

type:ALL

possible_keys:NULL

key:NULL

key_len:NULL

ref:NULL

rows:998490

filtered:100.00

Extra:Usingtemporary

1rowinset,1warning(0.00sec)

mysql>selectg,sum(g)sfromtblgroupbygorderbynulllimit5;

+---+------+

|g|s|

+---+------+

|0|0|

|1|2|

|4|4|

|5|5|

|6|12|

+---+------+

5rowsinset(7.75sec)

在这种情况下，MySQL也会进行全表扫描。但它不是运行额外的排序传递，而是创建一个临时表。此临时表每组包含一行，并且对于每个传入行，将更新相应组的值。很多更新！虽然这在内存中可能是合理的，但如果结果表太大以至于更新将导致大量磁盘IO，则会变得非常昂贵。在这种情况下，外部分拣计划通常更好。请注意，虽然MySQL默认选择此计划用于此用例，但如果我们不提供任何提示，它几乎比我们使用SQL_BIG_RESULT提示的计划慢10倍。您可能会注意到我在此查询中添加了“ORDERBYNULL”。这是为了向您展示“清理”临时表的唯一计划。没有它，我们得到这个计划：mysql>explainselectg,sum(g)sfromtblgroupbyglimit5G***************************1.row***************************id:1select_type:SIMPLEtable:tblpartitions:NULLtype:ALLpossible_keys:NULLkey:NULLkey_len:NULLref:NULLrows:998490filtered:100.00Extra:Usingtemporary;Usingfilesort1rowinset,1warning(0.00sec)

在其中，我们获得了temporary和filesort“两最糟糕的”提示。MySQL5.7总是返回按组顺序排序的GROUPBY结果，即使查询不需要它（这可能需要昂贵的额外排序传递）。ORDERBYNULL表示应用程序不需要这个。您应该注意，在某些情况下-例如使用聚合函数访问不同表中的列的JOIN查询-使用GROUPBY的临时表可能是唯一的选择。

如果要强制MySQL使用为GROUPBY执行临时表的计划，可以使用SQL_SMALL_RESULT提示。

4、MySQL中的索引基于跳过扫描的GROUPBY前三个GROUPBY执行方法适用于所有聚合函数。然而，其中一些人有第四种方法。

mysql>explainselectk,max(id)fromtblgroupbykG

***************************1.row***************************

id:1

select_type:SIMPLE

table:tbl

partitions:NULL

type:range

possible_keys:k

key:k

key_len:4

ref:NULL

rows:2

filtered:100.00

Extra:Usingindexforgroup-by

1rowinset,1warning(0.00sec)

mysql>selectk,max(id)fromtblgroupbyk;

+---+---------+

|k|max(id)|

+---+---------+

|0|2340920|

|1|2340916|

|2|2340932|

|3|2340928|

|4|2340924|

+---+---------+

5rowsinset(0.00sec)

此方法仅适用于非常特殊的聚合函数：MIN()和MAX()。这些并不需要遍历组中的所有行来计算值。他们可以直接跳转到组中的最小或最大组值（如果有这样的索引）。如果索引仅建立在(K)列上，如何找到每个组的MAX(ID)值？这是一个InnoDB表。记住InnoDB表有效地将PRIMARYKEY附加到所有索引。(K)变为(K,ID)，允许我们对此查询使用Skip-Scan优化。仅当每个组有大量行时才会启用此优化。否则，MySQL更倾向于使用更传统的方法来执行此查询（如方法＃1中详述的索引有序GROUPBY）。虽然我们使用MIN()/MAX()聚合函数，但其他优化也适用于它们。例如，如果您有一个没有GROUPBY的聚合函数（实际上所有表都有一个组），MySQL在统计分析阶段从索引中获取这些值，并避免在执行阶段完全读取表：mysql>explainselectmax(k)fromtblG***************************1.row***************************id:1select_type:SIMPLEtable:NULLpartitions:NULLtype:NULLpossible_keys:NULLkey:NULLkey_len:NULLref:NULLrows:NULLfiltered:NULLExtra:Selecttablesoptimizedaway1rowinset,1warning(0.00sec)

过滤和分组

我们已经研究了MySQL执行GROUPBY的四种方式。为简单起见，我在整个表上使用了GROUPBY，没有应用过滤。当您有WHERE子句时，相同的概念适用：mysql>explainselectg,sum(g)sfromtblwherek>4groupbygorderbyNULLlimit5G***************************1.row***************************id:1select_type:SIMPLEtable:tblpartitions:NULLtype:rangepossible_keys:kkey:kkey_len:4ref:NULLrows:1filtered:100.00Extra:Usingindexcondition;Usingtemporary1rowinset,1warning(0.00sec)

对于这种情况，我们使用K列上的范围进行数据过滤/查找，并在有临时表时执行GROUPBY。在某些情况下，方法不会发生冲突。但是，在其他情况下，我们必须选择使用GROUPBY的一个索引或其他索引进行过滤：

mysql>altertabletbladdkey(g);

QueryOK,0rowsaffected(4.17sec)

Records:0Duplicates:0Warnings:0

mysql>explainselectg,sum(g)sfromtblwherek>1groupbyglimit5G

***************************1.row***************************

id:1

select_type:SIMPLE

table:tbl

partitions:NULL

type:index

possible_keys:k,g

key:g

key_len:4

ref:NULL

rows:16

filtered:50.00

Extra:Usingwhere

1rowinset,1warning(0.00sec)

mysql>explainselectg,sum(g)sfromtblwherek>4groupbyglimit5G

***************************1.row***************************

id:1

select_type:SIMPLE

table:tbl

partitions:NULL

type:range

possible_keys:k,g

key:k

key_len:4

ref:NULL

rows:1

filtered:100.00

Extra:Usingindexcondition;Usingtemporary;Usingfilesort

1rowinset,1warning(0.00sec)

根据此查询中使用的特定常量，我们可以看到我们对GROUPBY使用索引顺序扫描（并从索引中“放弃”以解析WHERE子句），或者使用索引来解析WHERE子句（但使用临时表来解析GROUPBY）。根据我的经验，这就是MySQLGROUPBY并不总是做出正确选择的地方。您可能需要使用FORCEINDEX以您希望的方式执行查询。

在SQL查询GROUP BY语句用于什么

在关系数据库的SQL查询中，GROUPBY语句用于结合合计函数，根据一个或多个列对结果集进行分组。下面举例说明：学生成绩表score中有学号xh、班级bj、总成绩zcj字段，现在需要统计本次考试各班有多少人参加selectcount(xh),bjfromscoregroupbybj

groupby后面可以跟两个参数吗

是的，`groupby`后面可以跟两个参数。第一个参数是用于分组的键，而第二个参数是用于指定分组操作的列。例如，假设有一个DataFrame对象df，它有两列'A'和'B'，我们想要按照列'A'进行分组，并对列'B'进行求和操作，可以使用以下代码：```pythondf.groupby('A')['B'].sum()```这样就会按照列'A'进行分组，并对每个分组中的列'B'进行求和。

好了，文章到此结束，希望可以帮助到大家。

本文由夕逆IT于2023-08-13发表在夕逆IT，如有疑问，请联系我们。
本文链接：http://xinin56.com/qianduan/6439.html

上一篇：数据库系统工程师是职称吗(中级数据库工程师证书)

下一篇：php一般用什么软件编写(最常用php开发工具)

group by数据库中什么意思，数据库order by用法

groupby和orderby区别

distinct和groupby的区别

group by是返回多少条数据

数据库的group和group by的用法

在SQL查询GROUP BY语句用于什么

groupby后面可以跟两个参数吗

最新文章

网站分类

精彩推荐

group by数据库中什么意思，数据库order by用法

groupby和orderby区别

distinct和groupby的区别

group by是返回多少条数据

数据库的group和group by的用法

在SQL查询GROUP BY语句用于什么

groupby后面可以跟两个参数吗

相关文章

最新文章

网站分类

精彩推荐