吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數據庫不使用外鍵的原因是什么

數據分析與開發 ? 來源:CSDN博客 ? 作者:CSDN博客 ? 2020-10-12 14:07 ? 次閱讀

當我們想要持久化地存儲數據時,使用關系型數據庫往往都是最穩妥的選擇,這不僅因為今天的關系型數據庫種類非常豐富并且穩定,還因為不同社區對關系型數據庫的支持都非常完備。我們在前面的文章中曾經分析過 為什么 MySQL 的自增主鍵不單調也不連續,這篇文章我們來分析關系型數據庫中另一個重要的概念 — 外鍵(Foreign Key)。

在關系型數據庫中,外鍵也被稱為關系鍵,它是關系型數據庫中提供關系表之間連接的多個列[^1],這一組數據列是當前關系表中的外鍵,也必須是另一個關系表中的候選鍵(Candidate Key),我們可以通過候選鍵在當前表中找到唯一的元素[^2]。在通常情況下,我們都會使用關系表中的主鍵作為其他表中的外鍵,這樣才可以滿足關系型數據庫對外鍵的約束。

圖 1 - 關系型數據庫與外鍵

外鍵不僅僅是數據庫表中的一個整數,它還提供了額外的一致性保證。因為數據庫往往是整個系統的真理之源(Source of Truth),所以保證數據的一致性和正確性非常重要,關系型數據庫雖然提供了外鍵、觸發器等特性保證一致性,但是在今天的生產環境中卻很少被使用。

引用完整性(Referential Integrity)是數據的屬性,如果數據擁有該屬性,那么數據中所有的引用都是合法的,在關系型數據庫的上下文中,這就意味著關系型數據庫中引用另一個表中的值必須存在[^3]。

ALTER TABLE postsADD CONSTRAINT FOREIGN KEY (author_id)REFERENCES authors(id);

上述 SQL 語句可以向關系表中增加外鍵約束,該 SQL 語句的執行前提是posts表中存在author_id字段。從 SQL 語句中的CONSTRAINT關鍵字我們也能推測出外鍵不是一種數據類型,它是不同關系表之間的約束。

圖 2 - 無狀態服務與數據庫

不使用外鍵的原因其實很簡單,MySQL、PostgreSQL 等關系型數據庫很難水平擴容,但是無狀態的服務往往都可以很容易地擴容。由于外鍵等特性需要數據庫執行額外的工作,而這些操作會占用數據庫的計算資源,所以我們可以將大部分的需求都遷移到無狀態的服務中完成以降低數據庫的工作負載。

根據更新和刪除時的行為不同,我們可以將外鍵分成RESTRICT、CASCADE和SET NULL等幾種[^4],當我們為關系表中的字段增加外鍵約束時,需要指定外鍵的類型,最常見的也就是RESTRICT和CASCADE兩種,其中RESTRICT為外鍵的默認類型,不同類型的外鍵會帶來不同的額外開銷,而這些額外開銷就是我們不使用外鍵的理由:

使用RESTRICT會在更新或者刪除記錄時對外鍵對應的記錄是否存在進行一致性檢查;

使用CASCADE會在更新或者刪除記錄時觸發級聯更新或者刪除操作;

注意:MySQL 中的NO ACTION和RESTRICT具有相同的語義[^5]。

接下來我們會詳細介紹關系型數據庫如何處理上述兩種不同類型的外鍵,而我們應該如何在應用中模擬這些功能。

一致性檢查

當我們使用默認的外鍵類型RESTRICT時,在創建、修改或者刪除記錄時都會檢查引用的合法性。想要在 MySQL 等數據庫中觸發外鍵的一致性檢查其實非常容易,假設我們的數據庫中包含posts(id, author_id, content)和authors(id, name)兩張表,在執行如下所示的操作時都會觸發數據庫對外鍵的檢查:

向posts表中插入數據時,檢查author_id是否在authors表中存在;

修改posts表中的數據時,檢查author_id是否在authors表中存在;

刪除authors表中的數據時,檢查posts中是否存在引用當前記錄的外鍵;

作為專門用于管理數據的系統,數據庫與應用服務相比能夠更好地保證完整性,而上述的這些操作都是引入外鍵帶來的額外工作,不過這也是數據庫保證數據完整性的必要代價。上述的這些分析都是理論上的定性分析,我們其實可以簡單的定量分析一下引入外鍵對性能的影響。

在這里我們在數據庫中同時創建authors、posts和foreign_key_posts三種表,如下所示,其中posts和foreign_key_posts兩個表中的列完全相同,只是foreign_key_posts表為author_id字段增加了RESTRICT類型的外鍵約束:

圖 3 - 外鍵性能測試關系圖

我們先在authors表中插入一條記錄,隨后分別在posts和foreign_key_posts中插入多條新數據列引用該條記錄,前者不會檢查外鍵的合法性,而后者會做額外的檢查。你可以在 這里 找到作者用來測試外鍵額外開銷的 Go 語言代碼[^6],經過多次基準測試,我們可以得到如下所示的結果:

BenchmarkBaseline-8 3770 309503 ns/opBenchmarkForeignKey-8 3331 317162 ns/op BenchmarkBaseline-8 3192 315506 ns/opBenchmarkForeignKey-8 3381 315577 ns/op BenchmarkBaseline-8 3298 312761 ns/opBenchmarkForeignKey-8 3829 345342 ns/op BenchmarkBaseline-8 3753 291642 ns/opBenchmarkForeignKey-8 3948 325239 ns/op

作者執行了 4 次外鍵的基準測試,雖然 4 次測試的結果不是特別穩定,但是使用外鍵的用例在每次測試中都明顯弱于不使用外鍵的用例,外鍵帶來的額外開銷分別為 ~2.47%、~0.02%、~10.41% 和 ~11.52%。這里的基準測試只是一個比較簡單的定量分析,但是我們也可以從結果中看到大概的趨勢 — 外鍵的完整性檢查確實會帶來額外的性能開銷,而這些開銷在高并發的服務中需要慎重考慮。

想要在應用程序中模擬數據庫外鍵的功能其實比較容易,我們只需要遵循以下的幾個準則:

向表中插入數據或者修改表中的數據時,都應該執行額外的SELECT語句確保它引用的數據在數據庫中存在;

在刪除數據之前需要執行額外的SELECT語句檢查是否存在當前記錄的引用;

需要注意的是為了保證一致性,我們需要在事務中執行上述的查詢和修改語句,這樣才能完整模擬外鍵的功能;當我們向posts表中插入或者修改數據時,需要的處理相對比較簡單,我們只需要執行有限的SELECT語句并按照如下所示的模式執行對應的操作就可以了:

BEGINSELECT * FROM authors WHERE id = FOR UPDATE;-- INSERT INTO posts ... / UPDATE posts ...END

但是如果我們要刪除authors表中的數據,就需要查詢所有引用authors數據的表;如果有 10 個表都有指向authors表的外鍵,我們就需要在 10 個表中查詢是否存在對應的記錄,這個過程相對比較麻煩,不過也是為了實現完整性的必要代價,不過這種模擬外鍵方法其實遠比使用外鍵更消耗資源,它不僅需要查詢關聯數據,還要通過網絡發送更多的數據包。

級聯操作

當我們在關系型數據庫中創建外鍵約束時,如果使用如下所示的 SQL 語句指定更新或者刪除記錄時使用CASCADE行為,那么在客戶端更新或者刪除數據時就會觸發級聯操作:

ALTER TABLE postsADD CONSTRAINT FOREIGN KEY (author_id)REFERENCES authors(id)ON UPDATE CASCADEON DELETE CASCADE;

當客戶端更新authors表中記錄的主鍵時,數據庫會同時更新posts表中所有引用該記錄的外鍵;

當客戶端刪除authors表中的記錄時,數據庫會刪除所有與authors表關聯的記錄;

不過無論是執行更新還是刪除操作,數據庫都可以保證各個關系表之間引用的一致性和合法性不會出現引用到不存在記錄的情況,與RESTRICT行為一樣,所有外鍵的更新和刪除行為都可以通過執行額外的檢查和操作保證數據的一致。

圖 4 - 復雜的級聯操作

雖然級聯刪除的出發點也是保證數據的完整性,但是在設計關系表之間的不同關系時,我們也需要注意級聯刪除引起的數據大規模刪除的問題。如上圖所示,當客戶端想要在數據庫中刪除authos表中的數據時,如果我們同時在authors和posts中指定了級聯刪除的行為,那么數據庫會同時刪除所有關聯的posts記錄以及與posts表關聯的comments數據。

這種涉及多級的級聯刪除行為在數據量較小的數據庫中不會導致問題,但是在數據量較大的數據庫中刪除關鍵數據可能會引起雪崩,一條記錄的刪除可能會被放大到幾十倍甚至上百倍,這些對磁盤的隨機讀寫會帶來巨大的開銷,是我們想要盡可能避免的情況。如果我們能夠較好地設計各個表之間的關系并且慎用CASCADE行為,這對于保證數據庫中數據的合法性有著很重要的意義,使用該特性可以避免數據庫中出現過期的、不合法的數據,但是在使用時也要合理預估可能造成的最壞情況。

手動實現數據庫的級聯刪除操作是可行的,如果我們在一個事務中按照順序刪除所有的數據,確實可以保證數據的一致性,但是這與外鍵的級聯刪除功能沒有太大的區別,反而會有更差的表現。如果我們能夠接受在一個時間窗口內的數據不一致,就可以將一個大號的刪除任務拆成多個子任務分批執行,降低對數據庫影響的峰值。

DELETE FROM posts WHERE author_id = 1 LIMIT 100;DELETE FROM posts WHERE author_id = 1 LIMIT 100;...DELETE FROM authors WHERE id = 1;

與數據庫外鍵的CASCADE相比,這種方式會帶來更大的額外開銷,只是我們能降低對數據庫性能的瞬時影響。

總結

外鍵提供的幾種在更新和刪除時的不同行為都可以幫助我們保證數據庫中數據的一致性和引用合法性,但是外鍵的使用也需要數據庫承擔額外的開銷,在大多數服務都可以水平擴容的今天,高并發場景中使用外鍵確實會影響服務的吞吐量上限。在數據庫之外手動實現外鍵的功能是可能的,但是卻會帶來很多維護上的成本或者需要我們在數據一致性上做出一些妥協。我們可以從可用性、一致性幾個方面分析使用外鍵、模擬外鍵以及不使用外鍵的差異:

不使用外鍵犧牲了數據庫中數據的一致性,但是卻能夠減少數據庫的負載;

模擬外鍵將一部分工作移到了數據庫之外,我們可能需要放棄一部分一致性以獲得更高的可用性,但是為了這部分可用性,我們會付出更多的研發與維護成本,也增加了與數據庫之間的網絡通信次數;

使用外鍵保證了數據庫中數據的一致性,也將全部的計算任務全部交給了數據庫;

在大多數不需要高并發或者對一致性有較強要求的系統中,我們可以直接使用數據庫提供的外鍵幫助我們對數據進行校驗,但是在對一致性要求不高的、復雜的場景或者大規模的團隊中,不使用外鍵也確實可以為數據庫減負,而大團隊也有更多的時間和精力去設計其他的方案,例如:分布式的關系型數據庫。

當我們考慮應不應該在數據庫中使用外鍵時,需要關注的核心我們的數據庫承擔這部分計算任務后會不會影響系統的可用性,在使用時也不應該一刀切的決定用或者不用外鍵,應該根據具體的場景做決策,我們在這里介紹了兩個使用外鍵時可能遇到的問題:

RESTRICT外鍵會在更新和刪除關系表中的數據時對外鍵約束的合法性進行檢查,保證外鍵不會引用到不存在的記錄;

CASCADE外鍵會在更新和刪除關系表中的數據時觸發對關聯記錄的更新和刪除,在數據量較大的數據庫中可能會有數量級的放大效果;

我們在很多時候其實并不能選擇是否使用外鍵,大多數公司的 DBA 都會對數據庫系統的使用有比較明確的規定,但是我們要清楚做出使用外鍵和不使用外鍵這一抉擇的原因。到最后,我們還是來看一些比較開放的相關問題,有興趣的讀者可以仔細思考一下下面的問題:

數據庫中還有哪些特性是我們在生產環境中不會使用的?為什么?

分布式的關系型數據庫與 MySQL 等傳統數據庫有哪些區別?

責任編輯人:CC

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    3848

    瀏覽量

    64688

原文標題:為什么數據庫不應該使用外鍵

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    MySQL數據庫的安裝

    MySQL數據庫的安裝 【一】各種數據庫的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】MySQL 介紹
    的頭像 發表于 01-14 11:25 ?131次閱讀
    MySQL<b class='flag-5'>數據庫</b>的安裝

    數據庫是哪種數據庫類型?

    數據庫是一種部署在虛擬計算環境中的數據庫,它融合了云計算的彈性和可擴展性,為用戶提供高效、靈活的數據庫服務。云數據庫主要分為兩大類:關系型數據庫
    的頭像 發表于 01-07 10:22 ?142次閱讀

    數據庫加密辦法

    企業對于數據的重視程度不言而喻,也衍生出了數據=資產的概念。但是數據泄漏的事件頻繁發生,為了保護數據資產,企業有必要對數據庫做一些針對性的措
    的頭像 發表于 12-24 09:47 ?154次閱讀

    數據庫數據恢復—Mysql數據庫表記錄丟失的數據恢復流程

    Mysql數據庫故障: Mysql數據庫表記錄丟失。 Mysql數據庫故障表現: 1、Mysql數據庫表中無任何數據或只有部分
    的頭像 發表于 12-16 11:05 ?224次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—Mysql<b class='flag-5'>數據庫</b>表記錄丟失的<b class='flag-5'>數據</b>恢復流程

    數據庫事件觸發的設置和應用

    數據庫無論對于生產管理還是很多的實際應用都非常重要。小編這次聊一下數據庫事件觸發的應用。示例使用了postgresql和Python。
    的頭像 發表于 12-13 15:14 ?219次閱讀

    數據庫數據恢復—MYSQL數據庫ibdata1文件損壞的數據恢復案例

    mysql數據庫故障: mysql數據庫文件ibdata1、MYI、MYD損壞。 故障表現:1、數據庫無法進行查詢等操作;2、使用mysqlcheck和myisamchk無法修復數據庫
    的頭像 發表于 12-09 11:05 ?224次閱讀

    Sybase數據恢復—Sybase數據庫無法啟動怎么恢復數據

    數據庫數據恢復工程師經過檢測,發現Sybase數據庫出現故障的原因是:異常斷電造成Sybase數據庫無法回寫正常
    的頭像 發表于 11-30 16:45 ?177次閱讀
    Sybase<b class='flag-5'>數據</b>恢復—Sybase<b class='flag-5'>數據庫</b>無法啟動怎么恢復<b class='flag-5'>數據</b>?

    LS10串口數據庫模塊擴SD卡功能

    LS10串口數據庫模塊擴SD卡功能
    的頭像 發表于 11-23 09:42 ?255次閱讀
    LS10串口<b class='flag-5'>數據庫</b>模塊<b class='flag-5'>外</b>擴SD卡功能

    數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

    一個運行在存儲上的SQLServer數據庫,有1000多個文件,大小幾十TB。數據庫每10天生成一個NDF文件,每個NDF幾百GB大小。數據庫包含兩個LDF文件。 存儲損壞,數據庫
    的頭像 發表于 10-31 13:21 ?337次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—通過拼接<b class='flag-5'>數據庫</b>碎片恢復SQLserver<b class='flag-5'>數據庫</b>

    Oracle數據恢復—異常斷電后Oracle數據庫報錯的數據恢復案例

    Oracle數據庫故障: 機房異常斷電后,Oracle數據庫報錯:“system01.dbf需要更多的恢復來保持一致性,數據庫無法打開”。數據
    的頭像 發表于 09-30 13:31 ?387次閱讀
    Oracle<b class='flag-5'>數據</b>恢復—異常斷電后Oracle<b class='flag-5'>數據庫</b>啟<b class='flag-5'>庫</b>報錯的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫出現823錯誤的數據恢復案例

    SQL Server數據庫故障: SQL Server附加數據庫出現錯誤823,附加數據庫失敗。數據庫沒有備份,無法通過備份恢復數據庫
    的頭像 發表于 09-20 11:46 ?410次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>出現823錯誤的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SqlServer數據庫底層File Record被截斷為0的數據恢復案例

    SQL Server數據庫數據無法被讀取。 經過數據庫數據恢復工程師的初步檢測,發現SQL Server數據庫文件無法被讀取的
    的頭像 發表于 07-26 11:27 ?449次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SqlServer<b class='flag-5'>數據庫</b>底層File Record被截斷為0的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫所在分區空間不足報錯的數據恢復案例

    SQL Server數據庫數據恢復環境: 某品牌服務器存儲中有兩組raid5磁盤陣列。操作系統層面跑著SQL Server數據庫,SQL Server數據庫存放在D盤分區中。
    的頭像 發表于 07-10 13:54 ?579次閱讀

    數據庫數據恢復—raid5陣列上層Sql Server數據庫數據恢復案例

    數據庫故障: 數據庫文件丟失,主要涉及3個數據庫,數千張表。數據庫文件丟失原因未知,不能確定丟失的
    的頭像 發表于 05-08 11:43 ?579次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—Sql Server數據庫文件丟失的數據恢復案例

    。存儲空間LUN劃分了兩個邏輯分區。 服務器故障&初檢: 由于未知原因,Sql Server數據庫文件丟失,丟失數據涉及到3個,表的數量有3000左右。
    的頭像 發表于 04-11 15:38 ?965次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—Sql Server<b class='flag-5'>數據庫</b>文件丟失的<b class='flag-5'>數據</b>恢復案例
    澳门百家乐有哪些| 娱乐城百家乐打不开| 七胜百家乐娱乐网| 大发888免费送奖金| 红原县| 百家乐官网对子的玩法| 百家乐必知技巧| bet365提款限制| 线上百家乐官网试玩| 利都百家乐官网国际娱乐平台 | 百家乐发牌盒子| 金沙娱乐城| 线上百家乐官网试玩| 百家乐隔一数打投注法| 大发888游戏平台稳定大发888| 澳门百家乐官网娱乐城怎么样| 百家乐棋牌游戏皇冠网| 赌百家乐的方法| 大发888体育注册| 百家乐官网破解策略| 网上百家乐真实度| 大发888怎么了| 百家乐官网赌博策略| 送现金百家乐的玩法技巧和规则| 隆化县| 百家乐官网视频打牌| 百家乐平台信誉| 北川| 真人百家乐代理合作| 新澳博国际娱乐| 北京百家乐官网网上投注| 百家乐玄机| 利高国际娱乐网| 线上百家乐官网怎么玩| 凌龙棋牌游戏大厅| 赌百家乐官网到底能赌博赢| 威尼斯人娱乐城网络百家乐| 百家乐官网是否有路子| 机械百家乐技巧| 真人百家乐官网玩法| 威尼斯人娱乐城真人赌博|