吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何優化MySQL百萬數據的深分頁問題

數據分析與開發 ? 來源:數據分析與開發 ? 作者:數據分析與開發 ? 2022-04-06 15:12 ? 次閱讀

前言

我們日常做分頁需求時,一般會用limit實現,但是當偏移量特別大的時候,查詢效率就變得低下。本文將分四個方案,討論如何優化MySQL百萬數據的深分頁問題,并附上最近優化生產慢SQL的實戰案例。

limit深分頁為什么會變慢?

先看下表結構哈:

CREATETABLEaccount(
idint(11)NOTNULLAUTO_INCREMENTCOMMENT'主鍵Id',
namevarchar(255)DEFAULTNULLCOMMENT'賬戶名',
balanceint(11)DEFAULTNULLCOMMENT'余額',
create_timedatetimeNOTNULLCOMMENT'創建時間',
update_timedatetimeNOTNULLONUPDATECURRENT_TIMESTAMPCOMMENT'更新時間',
PRIMARYKEY(id),
KEYidx_name(name),
KEYidx_update_time(update_time)//索引
)ENGINE=InnoDBAUTO_INCREMENT=1570068DEFAULTCHARSET=utf8ROW_FORMAT=REDUNDANTCOMMENT='賬戶表';

假設深分頁的執行SQL如下:

selectid,name,balancefromaccountwhereupdate_time>'2020-09-19'limit100000,10;

這個SQL的執行時間如下:

40531d44-ac98-11ec-aa7f-dac502259ad0.png

執行完需要0.742秒,深分頁為什么會變慢呢?如果換成 limit 0,10,只需要0.006秒哦

40691572-ac98-11ec-aa7f-dac502259ad0.png

我們先來看下這個SQL的執行流程:

  1. 通過普通二級索引樹idx_update_time,過濾update_time條件,找到滿足條件的記錄ID。
  2. 通過ID,回到主鍵索引樹,找到滿足記錄的行,然后取出展示的列(回表
  3. 掃描滿足條件的100010行,然后扔掉前100000行,返回。
407d71e8-ac98-11ec-aa7f-dac502259ad0.pngSQL的執行流程

執行計劃如下:40962e2c-ac98-11ec-aa7f-dac502259ad0.png

SQL變慢原因有兩個

  1. limit語句會先掃描offset+n行,然后再丟棄掉前offset行,返回后n行數據。也就是說limit 100000,10,就會掃描100010行,而limit 0,10,只掃描10行。
  2. limit 100000,10 掃描更多的行數,也意味著回表更多的次數。

通過子查詢優化

因為以上的SQL,回表了100010次,實際上,我們只需要10條數據,也就是我們只需要10次回表其實就夠了。因此,我們可以通過減少回表次數來優化。

回顧B+ 樹結構

那么,如何減少回表次數呢?我們先來復習下B+樹索引結構哈~

InnoDB中,索引分主鍵索引(聚簇索引)和二級索引

  • 主鍵索引,葉子節點存放的是整行數據
  • 二級索引,葉子節點存放的是主鍵的值
40a51554-ac98-11ec-aa7f-dac502259ad0.png

把條件轉移到主鍵索引樹

如果我們把查詢條件,轉移回到主鍵索引樹,那就可以減少回表次數啦。轉移到主鍵索引樹查詢的話,查詢條件得改為主鍵id了,之前SQL的update_time這些條件咋辦呢?抽到子查詢那里嘛~

子查詢那里怎么抽的呢?因為二級索引葉子節點是有主鍵ID的,所以我們直接根據update_time來查主鍵ID即可,同時我們把 limit 100000的條件,也轉移到子查詢,完整SQL如下:

selectid,name,balanceFROMaccountwhereid>=(selecta.idfromaccountawherea.update_time>='2020-09-19'limit100000,1)LIMIT10;寫漏了,可以補下時間條件在外面

查詢效果一樣的,執行時間只需要0.038秒!

40b9fe4c-ac98-11ec-aa7f-dac502259ad0.png

我們來看下執行計劃40d10f74-ac98-11ec-aa7f-dac502259ad0.png

由執行計劃得知,子查詢 table a查詢是用到了idx_update_time索引。首先在索引上拿到了聚集索引的主鍵ID,省去了回表操作,然后第二查詢直接根據第一個查詢的 ID往后再去查10個就可以了!

40e8d01e-ac98-11ec-aa7f-dac502259ad0.png

因此,這個方案是可以的~

INNER JOIN 延遲關聯

延遲關聯的優化思路,跟子查詢的優化思路其實是一樣的:都是把條件轉移到主鍵索引樹,然后減少回表。不同點是,延遲關聯使用了inner join代替子查詢。

優化后的SQL如下:

SELECTacct1.id,acct1.name,acct1.balanceFROMaccountacct1INNERJOIN(SELECTa.idFROMaccountaWHEREa.update_time>='2020-09-19'ORDERBYa.update_timeLIMIT100000,10)ASacct2onacct1.id=acct2.id;

查詢效果也是杠桿的,只需要0.034秒

40faef56-ac98-11ec-aa7f-dac502259ad0.png

執行計劃如下:

410e2580-ac98-11ec-aa7f-dac502259ad0.png

查詢思路就是,先通過idx_update_time二級索引樹查詢到滿足條件的主鍵ID,再與原表通過主鍵ID內連接,這樣后面直接走了主鍵索引了,同時也減少了回表。

標簽記錄法

limit 深分頁問題的本質原因就是:偏移量(offset)越大,mysql就會掃描越多的行,然后再拋棄掉。這樣就導致查詢性能的下降

其實我們可以采用標簽記錄法,就是標記一下上次查詢到哪一條了,下次再來查的時候,從該條開始往下掃描。就好像看書一樣,上次看到哪里了,你就折疊一下或者夾個書簽,下次來看的時候,直接就翻到啦

假設上一次記錄到100000,則SQL可以修改為:

selectid,name,balanceFROMaccountwhereid>100000orderbyidlimit10;

這樣的話,后面無論翻多少頁,性能都會不錯的,因為命中了id索引。但是這種方式有局限性:需要一種類似連續自增的字段。

使用between...and...

很多時候,可以將limit查詢轉換為已知位置的查詢,這樣MySQL通過范圍掃描between...and,就能獲得到對應的結果。

如果知道邊界值為100000,100010后,就可以這樣優化:

selectid,name,balanceFROMaccountwhereidbetween100000and100010orderbyid;

手把手實戰案例

我們一起來看一個實戰案例哈。假設現在有表結構如下,并且有200萬數據.

CREATETABLEaccount(
idvarchar(32)COLLATEutf8_binNOTNULLCOMMENT'主鍵',
account_novarchar(64)COLLATEutf8_binNOTNULLDEFAULT''COMMENT'賬號'
amountdecimal(20,2)DEFAULTNULLCOMMENT'金額'
typevarchar(10)COLLATEutf8_binDEFAULTNULLCOMMENT'類型A,B'
create_timedatetimeDEFAULTNULLCOMMENT'創建時間',
update_timedatetimeDEFAULTNULLCOMMENT'更新時間',
PRIMARYKEY(id),
KEY`idx_account_no`(account_no),
KEY`idx_create_time`(create_time)
)ENGINE=InnoDBDEFAULTCHARSET=utf8COLLATE=utf8_binCOMMENT='賬戶表'

業務需求是這樣:獲取最2021年的A類型賬戶數據,上報到大數據平臺。

一般思路的實現方式

很多伙伴接到這么一個需求,會直接這么實現了:

//查詢上報總數量
Integertotal=accountDAO.countAccount();

//查詢上報總數量對應的SQL
'countAccount'resultType="java.lang.Integer">
seelctcount(1)
fromaccount
wherecreate_time>='2021-01-010000'
andtype='A'


//計算頁數
intpageNo=total%pageSize==0?total/pageSize:(total/pageSize+1);

//分頁查詢,上報
for(inti=0;ilist=accountDAO.listAccountByPage(startRow,pageSize);
startRow=(pageNo-1)*pageSize;
//上報大數據
postBigData(list);
}

//分頁查詢SQL(可能存在limit深分頁問題,因為account表數據量幾百萬)
'listAccountByPage'>
seelct*
fromaccount
wherecreate_time>='2021-01-010000'
andtype='A'
limit#{startRow},#{pageSize}

實戰優化方案

以上的實現方案,會存在limit深分頁問題,因為account表數據量幾百萬。那怎么優化呢?

其實可以使用標簽記錄法,有些伙伴可能會有疑惑,id主鍵不是連續的呀,真的可以使用標簽記錄?

當然可以,id不是連續,我們可以通過order by讓它連續嘛。優化方案如下:

//查詢最小ID
StringlastId=accountDAO.queryMinId();

//查詢最小ID對應的SQL
"queryMinId"returnType=“java.lang.String”>
selectMIN(id)
fromaccount
wherecreate_time>='2021-01-010000'
andtype='A'


//一頁的條數
IntegerpageSize=100;

Listlist;
do{
list=listAccountByPage(lastId,pageSize);
//標簽記錄法,記錄上次查詢過的Id
lastId=list.get(list,size()-1).getId();
//上報大數據
postBigData(list);
}while(CollectionUtils.isNotEmpty(list));

"listAccountByPage">
select*
fromaccount
wherecreate_time>='2021-01-010000'
andid>#{lastId}
andtype='A'
orderbyidasc
limit#{pageSize}


審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • SQL
    SQL
    +關注

    關注

    1

    文章

    775

    瀏覽量

    44254
  • MySQL
    +關注

    關注

    1

    文章

    829

    瀏覽量

    26744

原文標題:聊聊如何解決 MySQL 深分頁問題

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    從Delphi、C++ Builder和Lazarus連接到MySQL數據

    ? 從 Delphi、C++ Builder 和 Lazarus 連接到 MySQL 數據MySQL 數據訪問組件(MyDAC)是一個組件庫,提供從 Delphi 和 C++ Bu
    的頭像 發表于 01-20 13:47 ?122次閱讀
    從Delphi、C++ Builder和Lazarus連接到<b class='flag-5'>MySQL</b><b class='flag-5'>數據</b>庫

    使用插件將Excel連接到MySQL/MariaDB

    ,可以快速地將數據MySQL 或 MariaDB 加載到 Excel,立即從數據庫刷新 Excel 工作簿中的數據,編輯這些數據,并將它
    的頭像 發表于 01-20 12:38 ?121次閱讀
    使用插件將Excel連接到<b class='flag-5'>MySQL</b>/MariaDB

    適用于MySQL和MariaDB的Python連接器:可靠的MySQL數據連接器和數據

    和 Linux 的 wheel 包分發。 直接連接 該解決方案使您能夠通過 TCP/IP 建立與 MySQL 或者 MariaDB 數據庫服務器的直接連接,而無需數據庫客戶端庫。另外直接連接可以提高 Python 應用程
    的頭像 發表于 01-17 12:18 ?123次閱讀
    適用于<b class='flag-5'>MySQL</b>和MariaDB的Python連接器:可靠的<b class='flag-5'>MySQL</b><b class='flag-5'>數據</b>連接器和<b class='flag-5'>數據</b>庫

    MySQL數據庫的安裝

    MySQL數據庫的安裝 【一】各種數據庫的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】
    的頭像 發表于 01-14 11:25 ?131次閱讀
    <b class='flag-5'>MySQL</b><b class='flag-5'>數據</b>庫的安裝

    數據數據恢復—Mysql數據庫表記錄丟失的數據恢復流程

    Mysql數據庫故障: Mysql數據庫表記錄丟失。 Mysql數據庫故障表現: 1、
    的頭像 發表于 12-16 11:05 ?224次閱讀
    <b class='flag-5'>數據</b>庫<b class='flag-5'>數據</b>恢復—<b class='flag-5'>Mysql</b><b class='flag-5'>數據</b>庫表記錄丟失的<b class='flag-5'>數據</b>恢復流程

    數據數據恢復—MYSQL數據庫ibdata1文件損壞的數據恢復案例

    mysql數據庫故障: mysql數據庫文件ibdata1、MYI、MYD損壞。 故障表現:1、數據庫無法進行查詢等操作;2、使用my
    的頭像 發表于 12-09 11:05 ?224次閱讀

    什么是虛擬內存分頁 Windows系統虛擬內存優化方法

    虛擬內存分頁概述 在Windows操作系統中,虛擬內存是通過分頁機制實現的。分頁允許系統將內存中的數據移動到硬盤上,以便為當前運行的程序騰出空間。這個過程對于保持系統的流暢運行至關重要
    的頭像 發表于 12-04 09:16 ?593次閱讀

    MySQL還能跟上PostgreSQL的步伐嗎

    Can MySQL Catch Up with PostgreSQL’s Momentum?[2] 譯者:馮若航[3],Vonng,Pigsty[4]?作者,PostgreSQL 大法師,數據庫老司機,云計算泥石流。 MySQL
    的頭像 發表于 11-18 10:16 ?272次閱讀
    <b class='flag-5'>MySQL</b>還能跟上PostgreSQL的步伐嗎

    香港云服務器怎么部署MySQL數據庫?

    在香港云服務器上部署MySQL數據庫的步驟如下: 步驟 1: 更新軟件包列表 首先,確保軟件包列表是最新的。在終端中執行以下命令: sudo apt update 步驟 2: 安裝 MySQL
    的頭像 發表于 11-14 16:15 ?229次閱讀

    MySQL編碼機制原理

    MyQL 編解碼機制介紹 問題解答 讀者問題簡介 為敘述方便,以下的「我」指代讀者 我們知道在 Java 中是通過 ?JDBC 來訪問數據庫的,以訪問 MySQL 為例,需要配置以下 url 才能訪問
    的頭像 發表于 11-09 11:01 ?299次閱讀

    適用于MySQL的dbForge架構比較

    dbForge Schema Compare for MySQL 是一種工具,用于輕松有效地比較和部署 MySQL 數據庫結構和腳本文件夾差異。該工具提供了 MySQL
    的頭像 發表于 10-28 09:41 ?259次閱讀
    適用于<b class='flag-5'>MySQL</b>的dbForge架構比較

    MySQL性能優化淺析及線上案例

    作者:京東健康 孟飛 1、 數據庫性能優化的意義 業務發展初期,數據庫中量一般都不高,也不太容易出一些性能問題或者出的問題也不大,但是當數據庫的量級達到一定規模之后,如果缺失有效的預警
    的頭像 發表于 10-22 15:17 ?742次閱讀
    <b class='flag-5'>MySQL</b>性能<b class='flag-5'>優化</b>淺析及線上案例

    華納云:如何修改MySQL的默認端口

    MySQL是世界上最流行的開源關系型數據庫管理系統之一。在某些情況下,由于安全性、網絡策略或端口沖突的原因,數據庫管理員可能需要更改MySQL服務的默認監聽端口。本文將指導您如何在不同
    的頭像 發表于 07-22 14:56 ?352次閱讀
    華納云:如何修改<b class='flag-5'>MySQL</b>的默認端口

    MySQL的整體邏輯架構

    支持多種存儲引擎是眾所周知的MySQL特性,也是MySQL架構的關鍵優勢之一。如果能夠理解MySQL Server與存儲引擎之間是怎樣通過API交互的,將大大有利于理解MySQL的核心
    的頭像 發表于 04-30 11:14 ?495次閱讀
    <b class='flag-5'>MySQL</b>的整體邏輯架構

    MySQL忘記root密碼解決方案

    mysql登錄密碼為password()算法加密,解密成本太高,以下為通用方案; 原理:mysql提供了特殊啟動方式,即跳過權限表驗證,啟動后,登錄不需要提供密碼; 登錄后,即可修改mysql
    的頭像 發表于 04-23 16:08 ?768次閱讀
    下三元八运24山详解| 澳门档百家乐官网的玩法技巧和规则| 赌场百家乐官网攻略| 百家乐官网押注方法| 百家乐玩法教材| 百家乐破解仪| 大发888 58| 免费百家乐官网娱乐城| 百家乐官网开过的路纸| 做生意住房买什么朝向| 百家乐官网7scs| 百家乐是怎么赌法| 大发888网页多少| 锡林浩特市| 旧金山百家乐官网的玩法技巧和规则| 澳门百家乐技巧| 网上百家乐怎么赌能赢钱| 易胜博网站| 百家乐官网赌博现金网| 百家乐园sun811.com| 大发888娱乐场下载新澳博| 大悟县| 大丰收百家乐官网的玩法技巧和规则 | 百家乐游戏软件开发| 大发888官方我的爱好| 网上玩百家乐官网有钱| 缅甸百家乐官网赌场| 单机百家乐游戏下| 开封市| 百家乐官网棋| 发中发百家乐的玩法技巧和规则| 蒙特卡罗娱乐网| 逍遥坊百家乐官网的玩法技巧和规则| 百家乐sxcbd| 双流县| 百家乐有哪几种| 桐庐棋牌世界| 百家乐官网五星宏辉怎么玩| 百家乐最新破| 赞皇县| 关于百家乐切入点|