MySQL排序后分页,因数据重复导致分页数据紊乱的问题

背景

前不久在写一个分页接口的时候,在测试阶段出现了排序结果紊乱且数据不正确的问题,那个接口是按照create_time进行排序的,但是对应的表中有很多相同create_time的数据,最后发现是因为 order by 排序的时候,如果排序字段中有多行相同的列值,则排序结果是不确定的。

复现

创建一个简单表,并插入一些数据

 

  1. mysql> desc people; 
  2. +-------------+-------------+------+-----+---------+----------------+ 
  3. | Field       | Type        | Null | Key | Default | Extra          | 
  4. +-------------+-------------+------+-----+---------+----------------+ 
  5. | id          | bigint(20)  | NO   | PRI | NULL    | auto_increment | 
  6. | name        | varchar(20) | NO   |     | NULL    |                | 
  7. | create_time | bigint(20)  | NO   |     | NULL    |                | 
  8. +-------------+-------------+------+-----+---------+----------------+ 
  9. 3 行于数据集 (0.02 秒) 
  10.  
  11. mysql> select * from people; 
  12. +----+--------+-------------+ 
  13. | id | name   | create_time | 
  14. +----+--------+-------------+ 
  15. | 1  | 张三 | 1           | 
  16. | 2  | 李四 | 2           | 
  17. | 3  | 王五 | 3           | 
  18. | 4  | 赵六 | 4           | 
  19. | 5  | 孙七 | 2           | 
  20. | 6  | 赵八 | 2           | 
  21. | 7  | 吴九 | 2           | 
  22. | 8  | 郑十 | 2           | 
  23. +----+--------+-------------+ 
  24. 8 行于数据集 (0.02 秒) 

 

分页的写法

分页一般有2个参数:page:表示第几页,从1开始,范围[1,+∞)pageSize:每页显示多少条记录,范围[1,+∞)

limit分页公式

(1)limit分页公式:curPage是当前第几页;pageSize是一页多少条记录

limit (curPage-1)*pageSize,pageSize(2)用的地方:sql语句中

select 列 from 表名 limit(curPage-1)*pageSize,pageSize;

查询复现

 

  1. mysql> select * from people order by create_time asc limit 0,2; 
  2. +----+--------+-------------+ 
  3. | id | name   | create_time | 
  4. +----+--------+-------------+ 
  5. | 1  | 张三 | 1           | 
  6. | 2  | 李四 | 2           | 
  7. +----+--------+-------------+ 
  8. 2 行于数据集 (0.06 秒) 
  9.  
  10. mysql> select * from people order by create_time asc limit 2,2; 
  11. +----+--------+-------------+ 
  12. | id | name   | create_time | 
  13. +----+--------+-------------+ 
  14. | 8  | 郑十 | 2           | 
  15. | 6  | 赵八 | 2           | 
  16. +----+--------+-------------+ 
  17. 2 行于数据集 (0.09 秒) 
  18.  
  19. mysql> select * from people order by create_time asc limit 4,2; 
  20. +----+--------+-------------+ 
  21. | id | name   | create_time | 
  22. +----+--------+-------------+ 
  23. | 6  | 赵八 | 2           | 
  24. | 7  | 吴九 | 2           | 
  25. +----+--------+-------------+ 
  26. 2 行于数据集 (0.04 秒) 
  27.  
  28. mysql> select * from people order by create_time asc limit 6,2; 
  29. +----+--------+-------------+ 
  30. | id | name   | create_time | 
  31. +----+--------+-------------+ 
  32. | 3  | 王五 | 3           | 
  33. | 4  | 赵六 | 4           | 
  34. +----+--------+-------------+ 
  35. 2 行于数据集 (0.05 秒) 

 

排序字段出现重复数据,这时可以加入第二个排序字段,提高排序的唯一性,

 

  1. mysql> select * from people order by create_time asc,id asc limit 0,2; 
  2. +----+--------+-------------+ 
  3. | id | name   | create_time | 
  4. +----+--------+-------------+ 
  5. | 1  | 张三 | 1           | 
  6. | 2  | 李四 | 2           | 
  7. +----+--------+-------------+ 
  8. 2 行于数据集 (0.05 秒) 
  9.  
  10. mysql> select * from people order by create_time asc,id asc limit 2,2; 
  11. +----+--------+-------------+ 
  12. | id | name   | create_time | 
  13. +----+--------+-------------+ 
  14. | 5  | 孙七 | 2           | 
  15. | 6  | 赵八 | 2           | 
  16. +----+--------+-------------+ 
  17. 2 行于数据集 (0.10 秒) 
  18.  
  19. mysql> select * from people order by create_time asc,id asc limit 4,2; 
  20. +----+--------+-------------+ 
  21. | id | name   | create_time | 
  22. +----+--------+-------------+ 
  23. | 7  | 吴九 | 2           | 
  24. | 8  | 郑十 | 2           | 
  25. +----+--------+-------------+ 
  26. 2 行于数据集 (0.05 秒) 
  27.  
  28. mysql> select * from people order by create_time asc,id asc limit 6,2; 
  29. +----+--------+-------------+ 
  30. | id | name   | create_time | 
  31. +----+--------+-------------+ 
  32. | 3  | 王五 | 3           | 
  33. | 4  | 赵六 | 4           | 
  34. +----+--------+-------------+ 
  35. 2 行于数据集 (0.03 秒) 

我们可以观察到第一次的查询中,缺少了‘孙七’的数据行,当我们加上了第二个排序字段时分页数据变得正常了。

总结

MySQL 使用 limit 进行分页时,可能会出现重复数据,通过加入 order by 子句可以解决,但是需要注意的是,如果排序字段有相同值的情况下,由于排序字段数据重复,可能会导致每次查询排序后结果顺序不同,分页还是会出现重复数据,这时可以加入第二个排序字段,提高排序的唯一性,最好保证排序的字段在表中的值是唯一的,这样就可以少写一个排序字段,增加查询效率,因为 order by 后面有多个排序字段时,无法用到索引。

 
友情链接
鄂ICP备19019357号-22