窗口函数 RANK() 和 DENSE_RANK() 都是用于计算某个分组中每一行的排名,区别在于它们对于并列排名的处理不同。具体来说:
RANK():如果有多行数据排名相同,它们的排名将会相同,下一个排名将会跳过这些排名相同的行。
DENSE_RANK():如果有多行数据排名相同,它们的排名也将相同,但是下一个排名将会继续紧随这些排名相同的行。
举个例子,假设有以下表格
+----+-------+ | id | score | +----+-------+ | 1 | 95 | | 2 | 80 | | 3 | 90 | | 4 | 95 | | 5 | 85 | +----+-------+
我们可以使用以下 SQL 查询语句来计算各个分数的排名:
SELECT id, score, RANK() OVER (ORDER BY score DESC) AS rank, DENSE_RANK() OVER (ORDER BY score DESC) AS dense_rank FROM scores;
执行该查询语句后,将得到以下结果:
+----+-------+------+------------+ | id | score | rank | dense_rank | +----+-------+------+------------+ | 1 | 95 | 1 | 1 | | 4 | 95 | 1 | 1 | | 3 | 90 | 3 | 2 | | 5 | 85 | 4 | 3 | | 2 | 80 | 5 | 4 | +----+-------+------+------------+
可以看到,根据分数排序后,id 为 1 和 4 的两行排名相同,它们的 RANK() 函数的返回值都是 1,但是 DENSE_RANK() 函数的返回值都是 1,下一个排名将会紧随在它们后面。而对于 id 为 3、5 和 2 的三行,它们的排名是不同的。
总的来说,RANK() 和 DENSE_RANK() 的主要区别就在于它们处理并列排名的方式不同。如果需要让排名紧密连续,可以使用 DENSE_RANK();如果需要跳过相同排名的行,可以使用 RANK()。