相信大家都對(duì)大名鼎鼎的ClickHouse有一定的了解了,它強(qiáng)大的數(shù)據(jù)分析性能讓人印象深刻。但在字節(jié)大量生產(chǎn)使用中,發(fā)現(xiàn)了ClickHouse依然存在了一定的限制。例如:
- 缺少完整的upsert和delete操作
- 多表關(guān)聯(lián)查詢能力弱
- 集群規(guī)模較大時(shí)可用性下降(對(duì)字節(jié)尤其如此)
- 沒有資源隔離能力
因此,我們決定將ClickHouse能力進(jìn)行全方位加強(qiáng),打造一款更強(qiáng)大的數(shù)據(jù)分析平臺(tái)。后面我們將從五個(gè)方面來(lái)和大家分享,本篇將詳細(xì)介紹我們是如何為ClickHouse增強(qiáng)資源隔離能力的。
廣告業(yè)務(wù)遇到的資源管控問(wèn)題
ClickHouse的資源管控能力不夠完善,在 insert、select 并發(fā)高的場(chǎng)景下會(huì)導(dǎo)致執(zhí)行失敗,影響用戶體驗(yàn)。這是因?yàn)樯鐓^(qū)版ClickHouse目前僅提供依據(jù)不同用戶的最大內(nèi)存控制,在超過(guò)閾值時(shí)會(huì)殺死執(zhí)行的 query。
在字節(jié)的廣告業(yè)務(wù)中,需要區(qū)分不同查詢的優(yōu)先級(jí);對(duì)查詢性能抖動(dòng)的容忍度較低;同時(shí)也需要支持adhoc能力;查詢類型廣泛、資源占用可能會(huì)較多。
ClickHouse提供的粗粒度并發(fā)控制不能滿足需求;
- 無(wú)法靈活控制并發(fā),導(dǎo)致查詢迅速占滿集群資源,部分后來(lái)的高優(yōu)查詢持續(xù)pending,導(dǎo)致報(bào)錯(cuò)。
- 無(wú)法給特定業(yè)務(wù)預(yù)留cpu資源,出現(xiàn)大查詢占滿cpu,而后來(lái)的查詢執(zhí)行時(shí)間大幅增加。
ByteHouse的解決方案:Resource Group
在這種情況下,字節(jié)在ByteHouse(字節(jié)基于ClickHouse能力增強(qiáng)的版本)中開發(fā)了資源管理的組件:Resource Group。
基本思路是將并發(fā)、內(nèi)存、CPU等資源拆分給不同的資源組,同時(shí)通過(guò)資源組的父子關(guān)系實(shí)現(xiàn)不同資源組共享部分資源的能力。當(dāng)用戶的查詢提交給引擎,依照定義的規(guī)則選定相應(yīng)的資源組,然后評(píng)估該資源組以及父資源組是否能夠執(zhí)行該查詢,如是則直接執(zhí)行,否則進(jìn)入該資源組的等待隊(duì)列,等待資源釋放。
并發(fā)控制
max_concurrent_queries 配置項(xiàng)控制一個(gè)資源組能夠同時(shí)運(yùn)行的查詢上限。當(dāng)資源組并發(fā)達(dá)到上限,或者該資源組的父資源組并發(fā)達(dá)到上限,引擎會(huì)把查詢放入該資源組的等待隊(duì)列。當(dāng)該資源組有一個(gè)查詢結(jié)束,引擎會(huì)執(zhí)行該資源組等待隊(duì)列中最早的查詢;如果此時(shí)該資源組等待隊(duì)列為空,則會(huì)觸發(fā)父資源組的資源釋放,進(jìn)一步觸發(fā)該父資源組的其他子資源組的等待隊(duì)列查詢執(zhí)行,實(shí)現(xiàn)并發(fā)quota在一個(gè)父資源組之間的共享。
內(nèi)存控制
每一個(gè)資源組可以配置一個(gè)軟性的內(nèi)存上限,當(dāng)資源組中的查詢使用內(nèi)存超過(guò)這個(gè)軟性限制之后,新查詢將會(huì)進(jìn)入等待隊(duì)列。和并發(fā)控制類似,內(nèi)存也會(huì)判斷父資源組的限制,并使用類似的邏輯實(shí)現(xiàn)內(nèi)存在一個(gè)父資源組之間的共享。
由于目前還沒有一個(gè)準(zhǔn)確的查詢占用內(nèi)存預(yù)估的模型,當(dāng)前采取的策略是預(yù)估+實(shí)際內(nèi)存矯正的模式,當(dāng)一個(gè)新查詢進(jìn)入時(shí),引擎會(huì)按照預(yù)估內(nèi)存評(píng)估是否可以執(zhí)行,在開始執(zhí)行之后則是利用查詢現(xiàn)有的memory_tracker在下一輪判斷之前矯正預(yù)估值。
此軟性的內(nèi)存限制不同于原生ClickHouse的硬性內(nèi)存限制,并不會(huì)殺死已經(jīng)在執(zhí)行的查詢,而是用于控制新查詢的可執(zhí)行判斷,因此可以配合使用。
CPU控制
ByteHouse使用cgroups提供的cpu controller實(shí)現(xiàn)資源組的CPU控制。Cpu controler通過(guò)使用 CFS 調(diào)度器將CPU資源按照相同的時(shí)間分片進(jìn)行分配,以實(shí)現(xiàn)不同group按照預(yù)定義的cpu shares占用相應(yīng)的CPU資源。
在ByteHouse內(nèi)部,我們實(shí)現(xiàn)了一個(gè)新的線程池類,在該類中給查詢分配線程資源時(shí),會(huì)依據(jù)當(dāng)前Context中記錄的資源組信息分配關(guān)聯(lián)到相應(yīng)cgroup的線程。
由于采用的CFS調(diào)度器,我們可以很容易的得到以下結(jié)論:
-
當(dāng)所有資源組都有查詢?cè)趫?zhí)行時(shí),每個(gè)資源組可以使用的CPU比例為 cpu_shares / sum(cpu_shares)
-
當(dāng)只有一個(gè)資源組有查詢?cè)趫?zhí)行時(shí),該資源組可以使用的CPU比例為 100%
因此每個(gè)資源組可以使用的CPU資源比例范圍就是 [cpu_shares/sum(cpu_shares), 100%],通過(guò)這個(gè)功能我們也就實(shí)現(xiàn)了兩個(gè)預(yù)期效果:
-
保證了每個(gè)資源可以使用的CPU資源下限
-
保證了在任何workload情況下服務(wù)器CPU資源的總體利用率
Resource Group帶來(lái)的效果提升
Resource Group能夠顯著的提升查詢體驗(yàn),為優(yōu)先業(yè)務(wù)的查詢提供保障,并且減小查詢返回時(shí)間的方差。與此同時(shí),也能夠?yàn)榧悍€(wěn)定性帶來(lái)提升,不會(huì)因?yàn)镺OM殺死執(zhí)行中的查詢,以及防止一個(gè)服務(wù)出現(xiàn)故障而拖垮整個(gè)集群。
ByteHouse的Resource Group主要有以下優(yōu)點(diǎn):
-
能夠在CPU、內(nèi)存、并發(fā)控制等全方位的提供資源隔離的能力
-
可以限制低優(yōu)先級(jí)查詢帶來(lái)的影響
-
降低寫入語(yǔ)句可能帶來(lái)的不良影響
在上文提到的廣告業(yè)務(wù)中,使用ByteHouse替換ClickHouse后,查詢時(shí)間明顯縮短,體驗(yàn)明顯改善。
應(yīng)用前:
應(yīng)用后:
可以看到上線前用戶每天的查詢平均耗時(shí)在2.3s到14.1s之間抖動(dòng),十分劇烈,用戶的使用體驗(yàn)很差。上線后每天的查詢平均耗時(shí)則在0.4s到1.7s之之間抖動(dòng),較好的保證了該優(yōu)先業(yè)務(wù)的查詢資源,并且顯著縮短的平均查詢返回時(shí)間。
這是本次ClickHouse增強(qiáng)計(jì)劃系列文章的最后一篇啦,除了這五篇文章提到的能力,ByteHouse還有有一個(gè)與ClickHouse使用不同執(zhí)行引擎的版本,能夠?qū)崿F(xiàn)全面的存算分離,是真正的云原生數(shù)據(jù)倉(cāng)庫(kù)!后續(xù)我們也將為大家?guī)?lái)專題介紹。
審核編輯 :李倩
-
內(nèi)存
+關(guān)注
關(guān)注
8文章
3055瀏覽量
74331 -
資源
+關(guān)注
關(guān)注
0文章
59瀏覽量
17827 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1461瀏覽量
34166
原文標(biāo)題:火山引擎:ClickHouse增強(qiáng)計(jì)劃之“資源隔離”
文章出處:【微信號(hào):芋道源碼,微信公眾號(hào):芋道源碼】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
ClickHouse:強(qiáng)大的數(shù)據(jù)分析引擎
![<b class='flag-5'>ClickHouse</b>:強(qiáng)大的數(shù)據(jù)分析引擎](https://file1.elecfans.com//web3/M00/01/B7/wKgZO2dXpiiADw9EAACgk7YTi4Q286.png)
TPSI3050Q1EVM汽車類增強(qiáng)型隔離式開關(guān)驅(qū)動(dòng)器
![TPSI3050Q1EVM汽車類<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>式開關(guān)驅(qū)動(dòng)器](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
ISO1644DWEVM具有GPIO的增強(qiáng)型隔離式I2C評(píng)估模塊
![ISO1644DWEVM具有GPIO的<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>式I2C評(píng)估模塊](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
ISO224增強(qiáng)型隔離放大器數(shù)據(jù)表
![ISO224<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>放大器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
AMC1351-Q1汽車精密增強(qiáng)型隔離放大器數(shù)據(jù)表
![AMC1351-Q1汽車精密<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>放大器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
AMC1350-Q1汽車精密增強(qiáng)型隔離放大器數(shù)據(jù)表
![AMC1350-Q1汽車精密<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>放大器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
AMC1305x高精度、增強(qiáng)隔離式Δ-Σ調(diào)制器數(shù)據(jù)表
![AMC1305x高精度、<b class='flag-5'>增強(qiáng)</b><b class='flag-5'>隔離</b>式Δ-Σ調(diào)制器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
AMC1304x具有LDO的高精度、增強(qiáng)隔離式 Δ-Σ調(diào)制器數(shù)據(jù)表
![AMC1304x具有LDO的高精度、<b class='flag-5'>增強(qiáng)</b><b class='flag-5'>隔離</b>式 Δ-Σ調(diào)制器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
AMC1350精密增強(qiáng)型隔離放大器數(shù)據(jù)表
![AMC1350精密<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>放大器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
AMC1303x小型、高精度、增強(qiáng)型隔離式Δ-Σ調(diào)制器數(shù)據(jù)表
![AMC1303x小型、高精度、<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>式Δ-Σ調(diào)制器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
AMC1306x小型、高精度、增強(qiáng)型隔離式Δ-Σ調(diào)制器數(shù)據(jù)表
![AMC1306x小型、高精度、<b class='flag-5'>增強(qiáng)</b>型<b class='flag-5'>隔離</b>式Δ-Σ調(diào)制器數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
供應(yīng)鏈場(chǎng)景使用ClickHouse最佳實(shí)踐
![供應(yīng)鏈場(chǎng)景使用<b class='flag-5'>ClickHouse</b>最佳實(shí)踐](https://file1.elecfans.com//web2/M00/FD/32/wKgZomaYvr6AfXDtAACYKYUhf1k339.png)
ClickHouse內(nèi)幕(3)基于索引的查詢優(yōu)化
![<b class='flag-5'>ClickHouse</b>內(nèi)幕(3)基于索引的查詢優(yōu)化](https://file1.elecfans.com//web2/M00/ED/87/wKgaomZnupqAPI15AAB2MeV7qvk592.png)
增強(qiáng)隔離雙通道門驅(qū)動(dòng)器UCC2154x數(shù)據(jù)表
![<b class='flag-5'>增強(qiáng)</b><b class='flag-5'>隔離</b>雙通道門驅(qū)動(dòng)器UCC2154x數(shù)據(jù)表](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
![](https://file1.elecfans.com/web2/M00/C5/37/wKgaomXyiPSAC6BFAAG04Lo3ubM228.png)
評(píng)論