聊一聊SQL Server中的Row_Number
排序函数提供了一个非常好的特性,即在SQL中为结果集中的记录分配编号。SQL中的Row_Number是其中一个函数,它允许我们为结果集数据的行分配排名或编号。根据使用的排序函数的类型,将不同的值分配给不同的行。
它们主要有以下几种类型:
- Row_Number
- Rank
- Dense_Rank
- NTile
在本文中,我们将讨论Row_Number在SQL中的使用。
要理解排序的概念,我们首先需要理解它的语法。语法是:
Rank() Over ( {Partition_By_Clause} Order_By_Clause)
首先,Rank()是为结果集数据分配编号或排序的函数。接下来,使用Over关键字和括号中指定的条件(换句话说,分区和Order by子句),以决定如何在结果集数据上启动和实现排序或编号。在我们继续之前,理解这两个关键字也是非常重要的。
order_by_子句
这个子句决定如何开始对数据排序或编号。例如,如果我们指定由EmployeeID desc秩序,它将导致降序排序的数据通过EmployeeID然后分配的等级记录,从1到n开始,我们使用基于排名的类型函数(换句话说,密集的排名等等)。
partition_by_子句
该子句主要提供对结果集数据的分组功能。当与order by子句结合使用时,它会导致对数据进行分组,然后根据我们使用的排序函数的类型(换句话说,就是排名、密集排名等等)对行进行排序。
因此,在使用排序函数时,over关键字和这两个子句一起处理记录的排序过程。
Row_Number函数
这个函数的工作方式是给记录分配连续的排序,而不会跳过结果集中的任何数字,无论它是否被分区。在讨论的最后,我们将看到什么是连续排名和不跳过任何记录。
为此,我们将创建一个名为DepartmentMembers的表,用于存储成员的名称及其DepartmentName。我知道这不是一个完美的数据库结构,但只是一个插入一些记录的示例表,以讨论概念。所以我们的设置表就像这样。
接下来,我们将对这两种情况应用Row_Number函数,并逐一进行讨论。在第一种情况下,我们将只应用order by子句,在第二种情况下,我们将添加partition by子句和order by子句。
这里的要点是,order by子句是应用排序函数的必要条件。
案例1:使用Order By子句对整个结果集排序
基于上面的语法和示例表中创建的数据,现在我们将应用Row_Number函数。所以我们的查询是:
SELECT ROW_NUMBER() OVER (ORDER BY DepartmentName DESC) AS GeneratedRank, MemberName, Gender, DepartmentName
FROM dbo.DepartmentMembers
现在执行这个查询并查看结果。
这个查询所做的是,它从表中选择结果,并按部门名称按降序对它们排序。此外,它为记录生成级别或编号,我们可以在generatedrink列中看到。因此,为记录生成了简单的编号。
案例2:使用Partition By子句对分区结果集排序
接下来,我们将向它添加Partition By子句。因此查询现在更改为:
SELECT ROW_NUMBER() OVER (PARTITION BY Gender ORDER BY DepartmentName DESC) AS GeneratedRank, MemberName, Gender, DepartmentName
FROM dbo.DepartmentMembers
现在运行查询并查看结果。
这次,partition by子句根据性别对结果进行分组,按部门名称按降序对组的数据进行排序,最后根据所使用的排序函数对结果进行编号或排名。
总结
因此,在上面的示例中,我们可以看到分配给记录的排序保持连续的顺序,无论它是一个完整的结果集还是一个分区的结果集。
order by子句的使用基本上只对记录应用编号,或者换句话说,决定编号的顺序或起点。此外,partition子句和order by首先对记录进行分组,并进一步基于order by子句应用编号。