Sharding-JDBC簡(jiǎn)介及適用場(chǎng)景
大小:0.5 MB 人氣: 2017-10-12 需要積分:1
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
標(biāo)簽:sharding(7810)
【編者按】數(shù)據(jù)庫(kù)分庫(kù)分表從互聯(lián)網(wǎng)時(shí)代開啟至今,一直是熱門話題。在NoSQL橫行的今天,關(guān)系型數(shù)據(jù)庫(kù)憑借其穩(wěn)定、查詢靈活、兼容等特性,仍被大多數(shù)公司作為首選數(shù)據(jù)庫(kù)。因此,合理采用分庫(kù)分表技術(shù)應(yīng)對(duì)海量數(shù)據(jù)和高并發(fā)對(duì)數(shù)據(jù)庫(kù)的沖擊,是各大互聯(lián)網(wǎng)公司不可避免的問題。雖然很多公司都致力于開發(fā)自己的分庫(kù)分表中間件,但截止目前,仍無完美的開源解決方案覆蓋此領(lǐng)域。
分庫(kù)分表適用場(chǎng)景
分庫(kù)分表用于應(yīng)對(duì)當(dāng)前互聯(lián)網(wǎng)常見的兩個(gè)場(chǎng)景——大數(shù)據(jù)量和高并發(fā)。通常分為垂直拆分和水平拆分兩種。
垂直拆分是根據(jù)業(yè)務(wù)將一個(gè)庫(kù)(表)拆分為多個(gè)庫(kù)(表)。如:將經(jīng)常和不常訪問的字段拆分至不同的庫(kù)或表中。由于與業(yè)務(wù)關(guān)系密切,目前的分庫(kù)分表產(chǎn)品均使用水平拆分方式。
水平拆分則是根據(jù)分片算法將一個(gè)庫(kù)(表)拆分為多個(gè)庫(kù)(表)。如:按照ID的最后一位以3取余,尾數(shù)是1的放入第1個(gè)庫(kù)(表),尾數(shù)是2的放入第2個(gè)庫(kù)(表)等。
關(guān)系型數(shù)據(jù)庫(kù)在大于一定數(shù)據(jù)量的情況下檢索性能會(huì)急劇下降。在面對(duì)互聯(lián)網(wǎng)海量數(shù)據(jù)情況時(shí),所有數(shù)據(jù)都存于一張表,顯然會(huì)輕易超過數(shù)據(jù)庫(kù)表可承受的數(shù)據(jù)量閥值。這個(gè)單表可承受的數(shù)據(jù)量閥值,需根據(jù)數(shù)據(jù)庫(kù)和并發(fā)量的差異,通過實(shí)際測(cè)試獲得。
單純的分表雖然可以解決數(shù)據(jù)量過大導(dǎo)致檢索變慢的問題,但無法解決過多并發(fā)請(qǐng)求訪問同一個(gè)庫(kù),導(dǎo)致數(shù)據(jù)庫(kù)響應(yīng)變慢的問題。所以通常水平拆分都至少要采用分庫(kù)的方式,用于一并解決大數(shù)據(jù)量和高并發(fā)的問題。這也是部分開源的分片數(shù)據(jù)庫(kù)中間件只支持分庫(kù)的原因。
但分表也有不可替代的適用場(chǎng)景。最常見的分表需求是事務(wù)問題。同在一個(gè)庫(kù)則不需考慮分布式事務(wù),善于使用同庫(kù)不同表可有效避免分布式事務(wù)帶來的麻煩。目前強(qiáng)一致性的分布式事務(wù)由于性能問題,導(dǎo)致使用起來并不一定比不分庫(kù)分表快。目前采用最終一致性的柔性事務(wù)居多。分表的另一個(gè)存在的理由是,過多的數(shù)據(jù)庫(kù)實(shí)例不利于運(yùn)維管理。綜上所述,最佳實(shí)踐是合理地配合使用分庫(kù)+分表。
Sharding-JDBC簡(jiǎn)介
Sharding-JDBC是當(dāng)當(dāng)應(yīng)用框架ddframe中,從關(guān)系型數(shù)據(jù)庫(kù)模塊dd-rdb中分離出來的數(shù)據(jù)庫(kù)水平分片框架,實(shí)現(xiàn)透明化數(shù)據(jù)庫(kù)分庫(kù)分表訪問。Sharding-JDBC是繼dubbox和elastic-job之后,ddframe系列開源的第3個(gè)項(xiàng)目。
Sharding-JDBC直接封裝JDBC API,可以理解為增強(qiáng)版的JDBC驅(qū)動(dòng),舊代碼遷移成本幾乎為零:
可適用于任何基于Java的ORM框架,如JPA、Hibernate、Mybatis、Spring JDBC Template或直接使用JDBC。可基于任何第三方的數(shù)據(jù)庫(kù)連接池,如DBCP、C3P0、 BoneCP、Druid等。理論上可支持任意實(shí)現(xiàn)JDBC規(guī)范的數(shù)據(jù)庫(kù)。雖然目前僅支持MySQL,但已有支持Oracle、SQLServer等數(shù)據(jù)庫(kù)的計(jì)劃。
Sharding-JDBC定位為輕量Java框架,使用客戶端直連數(shù)據(jù)庫(kù),以jar包形式提供服務(wù),無proxy代理層,無需額外部署,無其他依賴,DBA也無需改變?cè)械倪\(yùn)維方式。
Sharding-JDBC分片策略靈活,可支持等號(hào)、between、in等多維度分片,也可支持多分片鍵。
SQL解析功能完善,支持聚合、分組、排序、limit、or等查詢,并支持Binding Table以及笛卡爾積表查詢。
與常見開源產(chǎn)品對(duì)比
為了對(duì)其他開源項(xiàng)目表示尊重,我們無意評(píng)論目前仍在更新中的項(xiàng)目。這里僅列出目前停止更新,但仍然在數(shù)據(jù)庫(kù)分片領(lǐng)域非常有影響力的幾個(gè)項(xiàng)目,請(qǐng)參見表1。
表1 數(shù)據(jù)庫(kù)分片工具對(duì)比
通過以上表格可以看出,Cobar屬于中間層方案,在應(yīng)用程序和MySQL之間搭建一層Proxy。中間層介于應(yīng)用程序與數(shù)據(jù)庫(kù)間,需要做一次轉(zhuǎn)發(fā),而基于JDBC協(xié)議并無額外轉(zhuǎn)發(fā),直接由應(yīng)用程序連接數(shù)據(jù)庫(kù),性能上有些許優(yōu)勢(shì)。這里并非說明中間層一定不如客戶端直連,除了性能,需要考慮的因素還有很多,中間層更便于實(shí)現(xiàn)監(jiān)控、數(shù)據(jù)遷移、連接管理等功能。
Cobar-Client、TDDL和Sharding-JDBC均屬于客戶端直連方案。此方案的優(yōu)勢(shì)在于輕便、兼容性、性能以及對(duì)DBA影響小。其中Cobar-Client的實(shí)現(xiàn)方式基于ORM(Mybatis)框架,其兼容性與擴(kuò)展性不如基于JDBC協(xié)議的后兩者。
實(shí)現(xiàn)原理
前文已介紹了Sharding-JDBC是實(shí)現(xiàn)了JDBC協(xié)議的jar文件。基于JDBC協(xié)議的實(shí)現(xiàn)與基于MySQL等數(shù)據(jù)庫(kù)協(xié)議實(shí)現(xiàn)的中間層略有差別。
無論使用哪種架構(gòu),核心邏輯均極為相似,除了協(xié)議實(shí)現(xiàn)層不同(JDBC或數(shù)據(jù)庫(kù)協(xié)議),都會(huì)分為分片規(guī)則配置、SQL解析、SQL改寫、SQL路由、SQL執(zhí)行以及結(jié)果歸并等模塊。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%