內存管理之為什么需要cache

為什么需要cache

如果CPU需要將一個變量（假設地址是A）加1，一般分為以下3個步驟：

CPU 從主存中讀取地址A的數據到內部通用寄存器 x0（ARM64架構的通用寄存器之一）

通用寄存器 x0 加1

CPU 將通用寄存器 x0 的值寫入主存

我們將這個過程可以表示如下：

其實現實中，CPU通用寄存器的速度和主存之間存在著太大的差異。兩者之間的速度大致如下關系：

CPU register的速度一般小于1ns，主存的速度一般是65ns左右。速度差異近百倍。在硬件上，我們將cache放置在CPU和主存之間，作為主存數據的緩存。當CPU試圖從主存中load/store數據的時候， CPU會首先從cache中查找對應地址的數據是否緩存在cache 中。如果其數據緩存在cache中，直接從cache中拿到數據并返回給CPU。當存在cache的時候，以上程序如何運行的例子的流程將會變成如下：

CPU和主存之間直接數據傳輸的方式轉變成CPU和cache之間直接數據傳輸。cache負責和主存之間數據傳輸。

多級cache存儲結構

前面提到的cache，稱之為L1 cache（第一級cache）。我們在L1 cache 后面連接L2 cache，在L2 cache 和主存之間連接L3 cache。等級越高，速度越慢，容量越大。但是速度相比較主存而言，依然很快。不同等級cache速度之間關系如下：

經過3級cache的緩沖，各級cache和主存之間的速度最萌差也逐級減小。在一個真實的系統上，各級cache之間硬件上是如何關聯的呢？我們看下Cortex-A53架構上各級cache之間的硬件抽象框圖如下：

在Cortex-A53架構上，L1 cache分為單獨的instruction cache（ICache）和data cache（DCache）。L1 cache是CPU私有的，每個CPU都有一個L1 cache。一個cluster 內的所有CPU共享一個L2 cache，L2 cache不區分指令和數據，都可以緩存。所有cluster之間共享L3 cache。L3 cache通過總線和主存相連。

多級cache之間的配合工作

首先引入兩個名詞概念，命中和缺失。CPU要訪問的數據在cache中有緩存，稱為“命中” (hit)，反之則稱為“缺失” (miss)。多級cache之間是如何配合工作的呢？我們假設現在考慮的系統只有兩級cache。

inclusive cache(某一地址的數據可能存在多級緩存中) 當CPU試圖從某地址load數據時，首先從L1 cache中查詢是否命中，如果命中則把數據返回給CPU 如果L1 cache缺失，則繼續從L2 cache中查找。當L2 cache命中時，數據會返回給L1 cache以及CPU 如果L2 cache也缺失，很不幸，我們需要從主存中load數據，將數據返回給L2 cache、L1 cache及CPU

exclusive cache 這種cache保證某一地址的數據緩存只會存在于多級cache其中一級

直接映射緩存(Direct mapped cache)

我們繼續引入一些cache相關的名詞。cache的大小稱之為cahe size，代表cache可以緩存最大數據的大小。我們將cache平均分成相等的很多塊，每一個塊大小稱之為cache line，其大小是cache line size。例如一個64 Bytes大小的cache。如果我們將64 Bytes平均分成64塊，那么cache line就是1字節，總共64行cache line。如果我們將64 Bytes平均分成8塊，那么cache line就是8字節，總共8行cache line。現在的硬件設計中，一般cache line的大小是4-128 Byts。

這里有一點需要注意，cache line是cache和主存之間數據傳輸的最小單位。什么意思呢？當CPU試圖load一個字節數據的時候，如果cache缺失，那么cache控制器會從主存中一次性的load cache line大小的數據到cache中。例如，cache line大小是8字節。CPU即使讀取一個byte，在cache缺失后，cache會從主存中load 8字節填充整個cache line。

我們假設下面的講解都是針對64 Bytes大小的cache，并且cache line大小是8字節。我們可以類似把這塊cache想想成一個數組，數組總共8個元素，每個元素大小是8字節。就像下圖這樣。

現在我們考慮一個問題，CPU從0x0654地址讀取一個字節，cache控制器是如何判斷數據是否在cache中命中呢？cache大小相對于主存來說，可謂是小巫見大巫。所以cache肯定是只能緩存主存中極小一部分數據。我們如何根據地址在有限大小的cache中查找數據呢？現在硬件采取的做法是對地址進行散列（可以理解成地址取模操作）。我們接下來看看是如何做到的？

我們一共有8行cache line，cache line大小是8 Bytes。所以我們可以利用地址低3 bits（如上圖地址藍色部分）用來尋址8 bytes中某一字節，我們稱這部分bit組合為offset。同理，8行cache line，為了覆蓋所有行。我們需要3 bits（如上圖地址黃色部分）查找某一行，這部分地址部分稱之為index。現在我們知道，如果兩個不同的地址，其地址的bit3-bit5如果完全一樣的話，那么這兩個地址經過硬件散列之后都會找到同一個cache line。所以，當我們找到cache line之后，只代表我們訪問的地址對應的數據可能存在這個cache line中，但是也有可能是其他地址對應的數據。所以，我們又引入tag array區域，tag array和data array一一對應。每一個cache line都對應唯一一個tag，tag中保存的是整個地址位寬去除index和offset使用的bit剩余部分（如上圖地址綠色部分）。tag、index和offset三者組合就可以唯一確定一個地址了。因此，當我們根據地址中index位找到cache line后，取出當前cache line對應的tag，然后和地址中的tag進行比較，如果相等，這說明cache命中。如果不相等，說明當前cache line存儲的是其他地址的數據，這就是cache缺失。

我們可以從圖中看到tag旁邊還有一個valid bit，這個bit用來表示cache line中數據是否有效（例如：1代表有效；0代表無效）。當系統剛啟動時，cache中的數據都應該是無效的，因為還沒有緩存任何數據。cache控制器可以根據valid bit確認當前cache line數據是否有效。所以，上述比較tag確認cache line是否命中之前還會檢查valid bit是否有效。只有在有效的情況下，比較tag才有意義。如果無效，直接判定cache缺失。

上面的例子中，cache size是64 Bytes并且cache line size是8 bytes。offset、index和tag分別使用3 bits、3 bits和42 bits（假設地址寬度是48 bits）。我們現在再看一個例子：512 Bytes cache size，64 Bytes cache line size。根據之前的地址劃分方法，offset、index和tag分別使用6 bits、3 bits和39 bits。如下圖所示。

直接映射緩存的優缺點

直接映射緩存在硬件設計上會更加簡單，因此成本上也會較低。根據直接映射緩存的工作方式，我們可以畫出主存地址0x00-0x88地址對應的cache分布圖。

我們可以看到，地址0x00-0x3f地址處對應的數據可以覆蓋整個cache。0x40-0x7f地址的數據也同樣是覆蓋整個cache。我們現在思考一個問題，如果一個程序試圖依次訪問地址0x00、0x40、0x80，cache中的數據會發生什么呢？首先我們應該明白0x00、0x40、0x80地址中index部分是一樣的。因此，這3個地址對應的cache line是同一個。所以，當我們訪問0x00地址時，cache會缺失，然后數據會從主存中加載到cache中第0行cache line。當我們訪問0x40地址時，依然索引到cache中第0行cache line，由于此時cache line中存儲的是地址0x00地址對應的數據，所以此時依然會cache缺失。然后從主存中加載0x40地址數據到第一行cache line中。同理，繼續訪問0x80地址，依然會cache缺失。這就相當于每次訪問數據都要從主存中讀取，所以cache的存在并沒有對性能有什么提升。訪問0x40地址時，就會把0x00地址緩存的數據替換。這種現象叫做cache顛簸（cache thrashing）。針對這個問題，我們引入多路組相連緩存。我們首先研究下最簡單的兩路組相連緩存的工作原理。

兩路組相連緩存(Two-way set associative cache)

我們依然假設64 Bytes cache size，cache line size是8 Bytes。什么是路（way）的概念。我們將cache平均分成多份，每一份就是一路。因此，兩路組相連緩存就是將cache平均分成2份，每份32 Bytes。如下圖所示。

cache被分成2路，每路包含4行cache line。我們將所有索引一樣的cache line組合在一起稱之為組。例如，上圖中一個組有兩個cache line，總共4個組。我們依然假設從地址0x0654地址讀取一個字節數據。由于cache line size是8 Bytes，因此offset需要3 bits，這和之前直接映射緩存一樣。不一樣的地方是index，在兩路組相連緩存中，index只需要2 bits，因為一路只有4行cache line。上面的例子根據index找到第2行cache line（從0開始計算），第2行對應2個cache line，分別對應way 0和way 1。因此index也可以稱作set index（組索引）。先根據index找到set，然后將組內的所有cache line對應的tag取出來和地址中的tag部分對比，如果其中一個相等就意味著命中。

因此，兩路組相連緩存較直接映射緩存最大的差異就是：第一個地址對應的數據可以對應2個cache line，而直接映射緩存一個地址只對應一個cache line。那么這究竟有什么好處呢？

兩路組相連緩存優缺點

兩路組相連緩存的硬件成本相對于直接映射緩存更高。因為其每次比較tag的時候需要比較多個cache line對應的tag（某些硬件可能還會做并行比較，增加比較速度，這就增加了硬件設計復雜度）。為什么我們還需要兩路組相連緩存呢？因為其可以有助于降低cache顛簸可能性。那么是如何降低的呢？根據兩路組相連緩存的工作方式，我們可以畫出主存地址0x00-0x4f地址對應的cache分布圖。

我們依然考慮直接映射緩存一節的問題“如果一個程序試圖依次訪問地址0x00、0x40、0x80，cache中的數據會發生什么呢？”。現在0x00地址的數據可以被加載到way 1，0x40可以被加載到way 0。這樣是不是就在一定程度上避免了直接映射緩存的尷尬境地呢？在兩路組相連緩存的情況下，0x00和0x40地址的數據都緩存在cache中。試想一下，如果我們是4路組相連緩存，后面繼續訪問0x80，也可能被被緩存。

因此，當cache size一定的情況下，組相連緩存對性能的提升最差情況下也和直接映射緩存一樣，在大部分情況下組相連緩存效果比直接映射緩存好。同時，其降低了cache顛簸的頻率。從某種程度上來說，直接映射緩存是組相連緩存的一種特殊情況，每個組只有一個cache line而已。因此，直接映射緩存也可以稱作單路組相連緩存。

全相連緩存(Full associative cache)

既然組相連緩存那么好，如果所有的cache line都在一個組內。豈不是性能更好。是的，這種緩存就是全相連緩存。我們依然以64 Byts大小cache為例說明。

由于所有的cache line都在一個組內，因此地址中不需要set index部分。因為，只有一個組讓你選擇，間接來說就是你沒得選。我們根據地址中的tag部分和所有的cache line對應的tag進行比較（硬件上可能并行比較也可能串行比較）。哪個tag比較相等，就意味著命中某個cache line。因此，在全相連緩存中，任意地址的數據可以緩存在任意的cache line中。所以，這可以最大程度的降低cache顛簸的頻率。但是硬件成本上也是更高。

Cache分配策略(Cache allocation policy)

cache的分配策略是指我們什么情況下應該為數據分配cache line。cache分配策略分為讀和寫兩種情況。

讀分配(read allocation) 當CPU讀數據時，發生cache缺失，這種情況下都會分配一個cache line緩存從主存讀取的數據。默認情況下，cache都支持讀分配。

寫分配(write allocation) 當CPU寫數據發生cache缺失時，才會考慮寫分配策略。當我們不支持寫分配的情況下，寫指令只會更新主存數據，然后就結束了。當支持寫分配的時候，我們首先從主存中加載數據到cache line中（相當于先做個讀分配動作），然后會更新cache line中的數據。

Cache更新策略(Cache update policy)

cache更新策略是指當發生cache命中時，寫操作應該如何更新數據。cache更新策略分成兩種：寫直通和回寫。

寫直通(write through) 當CPU執行store指令并在cache命中時，我們更新cache中的數據并且更新主存中的數據。cache和主存的數據始終保持一致。

寫回(write back) 當CPU執行store指令并在cache命中時，我們只更新cache中的數據。并且每個cache line中會有一個bit位記錄數據是否被修改過，稱之為dirty bit（翻翻前面的圖片，cache line旁邊有一個D就是dirty bit）。我們會將dirty bit置位。主存中的數據只會在cache line被替換或者顯示的clean操作時更新。因此，主存中的數據可能是未修改的數據，而修改的數據躺在cache中。cache和主存的數據可能不一致。

同時思考個問題，為什么cache line大小是cache控制器和主存之間數據傳輸的最小單位呢？這也是因為每個cache line只有一個dirty bit。這一個dirty bit代表著整個cache line是否被修改的狀態。

Cache組織方式

但是，我們一直避開了一個關鍵問題。我們都知道cache控制器根據地址查找判斷是否命中，這里的地址究竟是虛擬地址(virtual address，VA)還是物理地址(physical address，PA)？

虛擬高速緩存(VIVT)

我們首先介紹的是虛擬高速緩存，這種cache硬件設計簡單。在cache誕生之初，大部分的處理器都使用這種方式。虛擬高速緩存以虛擬地址作為查找對象。如下圖所示。

虛擬地址直接送到cache控制器，如果cache hit。直接從cache中返回數據給CPU。如果cache miss，則把虛擬地址發往MMU，經過MMU轉換成物理地址，根據物理地址從主存(main memory)讀取數據。但是，正是使用了虛擬地址作為tag，所以引入很多軟件使用上的問題。操作系統在管理高速緩存正確工作的過程中，主要會面臨兩個問題。歧義(ambiguity)和別名(alias)。為了保證系統的正確工作，操作系統負責避免出現歧義和別名。

歧義(ambiguity)

歧義是指不同的數據在cache中具有相同的tag和index。cache控制器判斷是否命中cache的依據就是tag和index，因此這種情況下，cache控制器根本沒辦法區分不同的數據。這就產生了歧義。什么情況下發生歧義呢？我們知道不同的物理地址存儲不同的數據，只要相同的虛擬地址映射不同的物理地址就會出現歧義。操作系統如何避免歧義的發生呢？當我們切換進程的時候，可以選擇flush所有的cache。flush cache操作有兩種：- 使主存儲器有效。針對write back高速緩存，首先應該使主存儲器有效，保證已經修改數據的cacheline寫回主存儲器，避免修改的數據丟失。- 使高速緩存無效。保證切換后的進程不會錯誤的命中上一個進程的緩存數據

因此，切換后的進程剛開始執行的時候，將會由于大量的cache miss導致性能損失。所以，VIVT高速緩存明顯的缺點之一就是經常需要flush cache以保證歧義不會發生，最終導致性能的損失。VIVT高速緩存除了面對歧義問題外，還面臨另一個問題：別名(alias)。

別名(alias)

當不同的虛擬地址映射相同的物理地址，而這些虛擬地址的index不同，此時就發生了別名現象(多個虛擬地址被稱為別名)。通俗點來說就是指同一個物理地址的數據被加載到不同的cacheline中就會出現別名現象。

針對共享數據所在頁的映射方式采用nocache映射。例如上面的例子中，0x2000和0x4000映射物理地址0x8000的時候都采用nocache的方式，這樣不通過cache的訪問，肯定可以避免這種問題。但是這樣就損失了cache帶來的性能好處。這種方法既適用于不同進程共享數據，也適用于同一個進程共享數據。如果是不同進程之間共享數據，還可以在進程切換時主動flush cache(使主存儲器有效和使高速緩存無效)的方式避免別名現象。但是，如果是同一個進程共享數據該怎么辦？除了nocache映射之外，還可以有另一種解決方案。這種方法只針對直接映射高速緩存，并且使用了寫分配機制有效。在建立共享數據映射時，保證每次分配的虛擬地址都索引到相同的cacheline。這種方式，后面還會重點說。

物理高速緩存(PIPT)

基于對VIVT高速緩存的認識，我們知道VIVT高速緩存存在歧義和名別兩大問題。主要問題原因是：tag取自虛擬地址導致歧義，index取自虛擬地址導致別名。所以，如果想讓操作系統少操心，最簡單的方法是tag和index都取自物理地址。物理的地址tag部分是獨一無二的，因此肯定不會導致歧義。而針對同一個物理地址，index也是唯一的，因此加載到cache中也是唯一的cacheline，所以也不會存在別名。我們稱這種cache為物理高速緩存，簡稱PIPT(Physically Indexed Physically Tagged)。PIPT工作原理如下圖所示。

CPU發出的虛擬地址經過MMU轉換成物理地址，物理地址發往cache控制器查找確認是否命中cache。雖然PIPT方式在軟件層面基本不需要維護，但是硬件設計上比VIVT復雜很多。因此硬件成本也更高。同時，由于虛擬地址每次都要翻譯成物理地址，因此在查找性能上沒有VIVT方式簡潔高效，畢竟PIPT方式需要等待虛擬地址轉換物理地址完成后才能去查找cache。順便提一下，為了加快MMU翻譯虛擬地址的速度，硬件上也會加入一塊cache，作用是緩存虛擬地址和物理地址的映射關系，這塊cache稱之為TLB(Translation Lookaside Buffer)。當MMU需要轉換虛擬地址時，首先從TLB中查找，如果cache hit，則直接返回物理地址。如果cache miss則需要MMU查找頁表。這樣就加快了虛擬地址轉換物理地址的速度。如果系統采用的PIPT的cache，那么軟件層面基本不需要任何的維護就可以避免歧義和別名問題。這是PIPT最大的優點。現在的CPU很多都是采用PIPT高速緩存設計。在Linux內核中，可以看到針對PIPT高速緩存的管理函數都是空函數，無需任何的管理。

物理標記的虛擬高速緩存(VIPT)

為了提升cache查找性能，我們不想等到虛擬地址轉換物理地址完成后才能查找cache。因此，我們可以使用虛擬地址對應的index位查找cache，與此同時(硬件上同時進行)將虛擬地址發到MMU轉換成物理地址。當MMU轉換完成，同時cache控制器也查找完成，此時比較cacheline對應的tag和物理地址tag域，以此判斷是否命中cache。我們稱這種高速緩存為VIPT(Virtually Indexed Physically Tagged)。

VIPT以物理地址部分位作為tag，因此我們不會存在歧義問題。但是，采用虛擬地址作為index，所以可能依然存在別名問題。是否存在別名問題，需要考慮cache的結構，我們需要分情況考慮。

VIPT Cache為什么不存在歧義

在這里重點介紹下為什么VIPT Cache不存在歧義。假設以32位CPU為例，頁表映射最小單位是4KB。我們假設虛擬地址<12:4>位(這是一個有別名問題的VIPT Cache)作為index，于此同時將虛擬地址<31:12>發送到MMU轉換得到物理地址的<31:12>，這里我們把<31:12>作為tag，并不是<31:13>。這地方很關鍵，也就是說VIPT的tag取決于物理頁大小的剩余位數，而不是去掉index和offset的剩余位數。物理tag是惟一的，所以不存在歧義。

VIPT Cache什么情況不存在別名

我們知道VIPT的優點是查找cache和MMU轉換虛擬地址同時進行，所以性能上有所提升。歧義問題雖然不存在了，但是別名問題依舊可能存在，那么什么情況下別名問題不會存在呢？Linux系統中映射最小的單位是頁，一頁大小是4KB。那么意味著虛擬地址和其映射的物理地址的位<11...0>是一樣的。針對直接映射高速緩存，如果cache的size小于等于4KB，是否就意味著無論使用虛擬地址還是物理地址的低位查找cache結果都是一樣呢？是的，因為虛擬地址和物理地址對應的index是一樣的。這種情況，VIPT實際上相當于PIPT，軟件維護上和PIPT一樣。如果示例是一個四路組相連高速緩存呢？只要滿足一路的cache的大小小于等于4KB，那么也不會出現別名問題。

VIPT Cache的別名問題

假設系統使用的是直接映射高速緩存，cache大小是8KB，cacheline大小是256字節。這種情況下的VIPT就存在別名問題。因為index來自虛擬地址位<12...8>，虛擬地址和物理地址的位<11...8>是一樣的，但是bit12卻不一定相等。假設虛擬地址0x0000和虛擬地址0x1000都映射相同的物理地址0x4000。那么程序讀取0x0000時，系統將會從物理地址0x4000的數據加載到第0x00行cacheline。然后程序讀取0x1000數據，再次把物理地址0x4000的數據加載到第0x10行cacheline。這不，別名出現了。相同物理地址的數據被加載到不同cacheline中。

如何解決VIPT Cache別名問題

我們接著上面的例子說明。首先出現問題的場景是共享映射，也就是多個虛擬地址映射同一個物理地址才可能出現問題。我們需要想辦法避免相同的物理地址數據加載到不同的cacheline中。如何做到呢？那我們就避免上個例子中0x1000映射0x4000的情況發生。我們可以將虛擬地址0x2000映射到物理地址0x4000，而不是用虛擬地址0x1000。0x2000對應第0x00行cacheline，這樣就避免了別名現象出現。因此，在建立共享映射的時候，返回的虛擬地址都是按照cache大小對齊的地址，這樣就沒問題了。如果是多路組相連高速緩存的話，返回的虛擬地址必須是滿足一路cache大小對齊。在Linux的實現中，就是通過這種方法解決別名問題。

不存在的PIVT高速緩存

按照排列組合來說，應該還存在一種PIVT方式的高速緩存。因為PIVT沒有任何優點，卻包含以上的所有缺點。你想想，PIVT方式首先要通過MMU轉換成物理地址，然后才能根據物理地址index域查找cache。這在速度上沒有任何優勢，而且還存在歧義和別名問題。請忘記它吧。不，應該不算是忘記，因為它從來就沒出現過。

總結

VIVT Cache問題太多，軟件維護成本過高，是最難管理的高速緩存。所以現在基本只存在歷史的文章中。現在我們基本看不到硬件還在使用這種方式的cache。現在使用的方式是PIPT或者VIPT。如果多路組相連高速緩存的一路的大小小于等于4KB，一般硬件采用VIPT方式，因為這樣相當于PIPT，豈不美哉。當然，如果一路大小大于4KB，一般采用PIPT方式，也不排除VIPT方式，這就需要操作系統多操點心了。

編輯：黃飛

閱讀全文

cpu(206163) cpu(206163)
Cache(27954) Cache(27954)

Linux的內存管理是什么，Linux的內存管理詳解

Linux的內存管理 Linux的內存管理是一個非常復雜的過程，主要分成兩個大的部分：內核的內存管理和進程虛擬內存。內核的內存管理是Linux內存管理的核心，所以我們先對內核的內存管理進行簡介

2022-05-11 17:54:17

5183

cpu與cache內存交互的過程

CPU接收到指令后，它會最先向CPU中的一級緩存（L1 Cache）去尋找相關的數據，然一級緩存是與CPU同頻運行的，但是由于容量較小，所以不可能每次都命中。

2022-10-21 09:10:54

1866

走進Linux內存系統探尋內存管理的機制和奧秘

Linux 內存是后臺開發人員，需要深入了解的計算機資源。合理的使用內存，有助于提升機器的性能和穩定性。本文主要介紹Linux 內存組織結構和頁面布局，內存碎片產生原因和優化算法，Linux 內核幾種內存管理的方法，內存使用場景以及內存使用的那些坑。

2023-01-05 09:47:43

1338

一文詳解C語言內存管理

C語言內存管理指對系統內存的分配、創建、使用這一系列操作。

2023-07-26 16:04:48

424

Linux內存管理學習筆記

最開始的程序運行時只能跑一個進程的，那就不需要復雜的內存管理，把我弄到固定的位置，然后這片區域都是我的。而且有多大的內存我就用多大的，一旦我進程想用的內存比擁有的物理內存大的時候，崩了就完事了。

2023-10-30 14:14:36

232

深入理解Linux RCU：從硬件說起之內存屏障

上一篇文章我們談到了內存Cache，并且描述了典型的Cache一致性協議MESI。Cache的根本目的，是解決內存與CPU速度多達兩個數量級的性能差異。

2023-12-25 13:42:38

403

6678中CACHE的空間使用問題

參與運算操作時會發生cache存儲空間的使用沖突么？ 2、memset(void *buffer, int value, int count),對buffer起作用的是它cache中的內容還是其所在的真正內存中的內容？？

2018-06-21 13:28:12

Cache機制的原理是什么？

的高速度。CPU與外設交換數據時經常用到buffer(緩沖)，這與緩存極其相似，只不過Cache是為了提高CPU和內存之間的數據交換速度而設計，而buffer是為了提高內存和硬盤(或其他I／O設備)之間的數據交換速度而設計的。

2019-10-12 06:01:10

cache 問題

各位專家： ? ? ? ?我之前把數據放在ddr中，1024點fft需要40萬個周期，后來放在L2中，只需要10000左右的周期。但是還有其他的數據較大，只能放在ddr中，那請問怎么才能

2018-06-21 15:10:16

cache有哪些缺點？實現cache的組織方式有哪幾種

在一次hit-miss檢查中需要比較多個tag。set-way在組相聯cache中，cache被分成許多大小相同的部分，稱為way。然后相同的內存地址訪問可以映射到特定set(index)的多個way

2022-06-15 16:16:16

cache的應用——什么時候需要刷cache1

文章目錄1、cache的應用——什么時候需要刷cache1、cache的應用——什么時候需要刷cache(1)、cpu在往內存(src地址)寫數據時,cache中會緩存這些數據,并沒有立即同步到

2021-07-22 08:43:16

內存管理

我寫個數據實時采集、監控、存儲的程序！需要這個程序連續運行一周這么長的時間！我是菜鳥，不懂內存管理方面的問題，害怕到時候運行一段時間，程序會因為內存不足而斷開！希望大神們能知道一下！另外，我看到

2013-03-27 17:43:50

內存管理概述及原理

記錄一下，方便以后翻閱~主要內容：1）內存管理概述及原理；2）相關實驗代碼解讀。官方資料：《STM32中文參考手冊_V10》-第19章靈活的靜態存儲器控制器(FSMC)。實驗要求：系統啟動后

2022-02-23 06:15:20

內存管理簡介

內存管理1.內存管理簡介2. 硬件設計3. 軟件設計3.1 STM32CubeMX設置3.2 MDK-ARM編程4. 下載驗證

2021-12-13 06:17:34

內存分配及Cache優化

內存分配及Cache優化　　與PC機相比，DSP的程序數據存儲空間非常有限。因此，對于視頻編碼這種需要處理大量數據的程序而言，必須合理安排數據和程序的存儲方式，實現對存儲器的優化。實驗表明，合理

2011-08-10 14:54:23

CPU如何操作內存

的信息。之后，當真的需要更新主存時，處理器會把那個被修改了的緩存線整體放到總線上，一次性寫入內存。所以大部分的請求事務，其數據長度字段都是11（REQ[1:0]），對應64 字節。下圖展示了當cache

2018-02-07 10:54:05

FreeRTOS內存管理的算法解析？

關于FreeRTOS內存管理，有人測試過它給定的算法么？會不會有內存碎片的出現，如果產品一直運行，會不會出現內存崩潰的情況。求證啊。目前用heap_2.c，但是這個算法是有碎片出現的。有沒有好的方法，來管理內存呢？

2020-07-30 11:39:50

Linux內存系統： Linux 內存分配算法

kmem_cache_alloc基于 slab 機制實現128KB適合需要頻繁申請釋放相同大小內存塊時使用kmalloc基于 kmem_cache_alloc 實現128KB最常見的分配方式，需要小于頁框大小的內存

2020-08-24 07:44:49

STM32內存管理精選資料分享

內存管理詳解1、介紹內存管理，是指軟件運行時對計算機內存資源的分配和使用的技術。其最主要的目的是如何高效，快速的分配，并且在適當的時候釋放和回收內存資源。內存管理的實現方法有很多種，他們其實最終都是

2021-08-24 06:52:43

STM32CubeMX的內存管理是什么？

2021-12-10 06:10:15

linux的內存釋放操作

在Linux系統下，我們一般不需要去釋放內存，因為系統已經將內存管理的很好。但是凡事也有例外，有的時候內存會被緩存占用掉，導致系統使用SWAP空間影響性能，此時就需要執行釋放內存（清理緩存）的操作

2019-07-26 07:05:04

windows內存管理技術

windows內存管理技術是怎么回事

2012-06-09 18:04:30

為什么需要cache？cache是如何影響code的呢

缺失，很不幸，我們需要從主存中load數據，將數據返回給L2 cache、L1 cache及CPU。這種多級cache的工作方式稱之為inclusive cache，也就是某一地址的數據可能存在多級

2022-04-21 11:10:49

為什么需要虛擬內存呢

3.4.1 轉換檢測緩沖區（TLB）3.4.2 軟件TLB管理3.5 針對大內存的頁表3.5.1 多級頁表X 往期文章0 前文《現代操作系統》03章存儲管理（一）3 虛擬內存為什么需要虛擬內存呢？這是軟件發展帶來的需求，軟件功能越來越豐富導致體積越來越大，即使內存的空間也在不斷增大但依然無法趕上軟件的

2022-02-23 06:10:55

介紹一種多級cache的包含策略（Cache inclusion policy）

。如果L2 cache較小，則在inclusive cache中浪費的cache容量更多。盡管exclusive cache具有更多的內存容量，但相比NINE cache，它需要占用更多的帶寬，因為L1

2022-07-20 14:46:15

關于cache和cache_line的一個概念問題

幫忙給解答一下一個基本概念，cpu在訪問數據時，如果數據不在L1D和L2中，就需要從DDR等外設中取數，文獻中說過，“cache會prefetch讀取cache_line長度的地址，保證連續的地址上

2018-06-21 17:31:26

關于RT-Thread內存管理的內存池簡析

這篇文章繼續介紹 RT-Thread 內存管理剩下的部分——內存池。為何引入內存池？內存堆雖然方便靈活，但是存在明顯的缺點：分配效率低。每次分配內存的時候，都需要查找空閑內存塊。容易產生內存碎片

2022-04-06 17:02:59

動態內存管理是什么？動態內存管理算法有哪幾種

詳細描述動態內存堆接口動態內存管理是一個真實的堆內存管理模塊，可以在當前資源滿足的情況下，根據用戶的需求分配任意大小的內存塊。而當用戶不需要再使用這些內存塊時，又可以釋放回堆中供其他應用分配

2022-08-29 15:23:12

動態內存管理的原理詳解

C/C++語言與其他語言不同，它需要開發者自己管理內存資源。對于動態內存的使用不當容易造成段錯誤或者內存泄漏。尤其是內存泄漏，內存泄漏往往是在程序運行一段時間才會被發現，使得開發人員無法第一時間定位

2020-11-02 09:25:31

基于Buddy算法的內存管理有什么優勢？

內存管理是操作系統的中心任務之一，其主要任務是組織內存以容納內核和待執行程序，跟蹤當前內存的使用情況，在需要時為進程分配內存，使用完畢后釋放并回收內存。目前嵌入式系統中常用的內存管理策略主要有兩種——靜態內存分配和動態內存分配。

2019-08-20 06:15:43

處理器在讀內存的過程中，CPU核、cache、MMU如何協同工作？

處理器中斷處理的過程是怎樣的？處理器在讀內存的過程中，CPU核、cache、MMU如何協同工作？

2021-10-18 08:57:48

寄存器、內存和Cache的關系是什么

的存儲器。由于CPU的速度遠高于主內存，CPU直接從內存中存取數據要等待一定時間周期，Cache中保存著CPU

2022-01-05 06:26:06

嵌入式Linux內存管理的知識

這個內存管理的知識點還真的需要我們專門的去理解一下，今天大家一起來學習學習嵌入式Linux內存管理的知識。

2021-02-03 06:30:19

嵌入式Linux內存管理知識點

這個內存管理的知識點還真的需要我們專門的去理解一下，今天大家一起來學習學習嵌入式Linux內存管理的知識。

2021-03-04 06:22:50

嵌入式中ARM的MMU和Cache機制

沒有操作系統的情況下，就需要我們自己來掌控它們了。其中，主要是合理分配內存。以下幾點需要著重考慮： 1) 安全第一！ -- 避免MMU和Cache的副作用。當你在無OS的裸機上開發程序時，初始化運行

2017-08-19 22:42:08

嵌入式系統內存管理

只需要使用虛擬地址尋址數據。這種使用虛擬地址尋址整個系統的主存和輔存的方式在現代操作系統中被稱為虛擬內存。MMU便是實現虛擬內存的必要條件。虛擬內存的管理方法使系統既可以運行體積比物理內存還要

2016-09-17 19:40:05

淺析cache控制器的分配策略與替換策略

在cache的相關操作中，cache控制器需要根據需求做出許多不同的選擇。例如：分配策略是否需要將數據從主存中分配到cache中；替換策略組相聯cache中，所有的way都已經有填充數據了，miss

2022-06-15 16:24:48

淺析中斷時間和內存管理

慕課電子科技大學.嵌入式系統.第十章.中斷時間和內存管理.內存管理0 目錄10 中斷時間和內存管理10.3 內存管理10.3.1課堂重點10.3.2測試與作業11 下一章0 目錄10 中斷時間和內存管理10.3 內存管理10.3.1課堂重點10.3.2測試與作業11 下一章博客地址: ...

2021-12-17 07:37:40

第18章內存管理

到了解決。其實RTX的內存管理也非常好理解，可以理解成一個二維數組，比如我們定義一個二維數組為：uint8_t mpool[10][32]。對應到RTX的內存管理上就是定義了10個內存塊，每塊大小是32字節。如果還需要其它大小的內存塊，還可以多定義幾個其它大小的。

2016-10-08 07:10:54

請問MSM的cache一致性維護需要注意些什么？

內存地址進行cache無效有何區別？3.csl庫的cache維護代碼，需不需要其他相關配置，為何有些語句不起作用？4.觀察memery brower發現MSM中的數據可能出現在L2cache中，但是L2的cache大小設置為0？謝謝！！！

2019-01-10 11:28:01

請問mymalloc是管理多個內存的嗎？

C語言自帶的malloc只能管理一個內存塊， mymalloc的話，就是管理多個內存的嗎？還有其他的區別嗎

2023-10-18 07:30:37

通過內存地址映射能否禁用MSMC上的cache

請教： ??????? 在程序設計時，有時涉及MSMC內存上的頻繁交互時，cache一致性維護相當令人頭疼。C6678不允許禁止MSMC上的cache，但是我們了解到TI提供了機制將某一段地址映射

2018-06-21 06:25:40

高速緩存cache的結構及常用術語介紹

具體情況而定。cache的初始訪問并不比正常內存訪問速度快，性能的提升來自于對該緩存數據的后續hit訪問。Cache 只保存主存的一個子集，所以需要一種方法來快速確定你要查找的地址是否在cache中

2022-06-15 16:30:39

通信設備中內存管理優化

通過對內存管理的分析，提出了內存優化算法。該算法解決了通信設備中由于大量消息的發送導致內存管理的問題，建立了用戶定義的內存管理區域，設計了新的內存管理隊列，

2009-02-21 11:42:35

一種可配置的Cache RAM存儲器的設計

不同的應用對存儲器結構有不同的需求：在運行控制任務時，需要Cache 匹配速度差異；在處理數據流時，需要片內存儲器提高訪問帶寬。本文設計了一種基于SRAM 的可配置Cache/SRAM

2010-01-25 11:53:55

Cache中Tag電路的設計

摘要：在SoC系統中，片上緩存(Cache)的采用是解決片上處理器和片外存儲器之間速度差異的重要方法，Cache中用來存儲標記位并判斷Cache是否命中的Tag電路的設計將會影響到整個Cache的

2010-05-08 09:26:24

μClinux內存管理分析

laClinux內存管理采用非標準Linux內存模型。系統為進程分配連續內存區域，代碼段、數據段和棧段間無空隙，且進程私有堆被取消，所有進程共享由操作系統管理的堆空間。最簡單

2010-09-25 16:33:17

什么是緩存Cache

什么是緩存Cache 即高速緩沖存儲器，是位于CPU與主內存間的一種容量較小但速度很高的存儲器。由于CPU的速度遠高于主內存，CPU直接

2010-01-23 10:57:13

735

什么是Cache/SIMD?

什么是Cache/SIMD? 　 Cache ：即高速緩沖存儲器，是位于CPU與主內存間的一種容量較小但速度很高的存儲器。由于CPU的速度遠高于主內存

2010-02-04 11:29:44

515

什么是Instructions Cache/IMM/ID

什么是Instructions Cache/IMM/ID Instructions Cache：（指令緩存）由于系統主內存的速度較慢，當CPU讀取指令的時候，會導致CPU停下來

2010-02-04 11:51:01

583

什么是Cache

什么是Cache 英文縮寫: Cache 中文譯名: 高速緩存器分　　類: IP與多媒體解　　釋: 信息在本地的臨時存儲

2010-02-22 17:26:39

948

高速緩存(Cache),高速緩存(Cache)原理是什么?

高速緩存(Cache),高速緩存(Cache)原理是什么? 高速緩存Cache是位于CPU和主存儲器之間規模較小、存取速度快捷的靜態存儲器。Cache一般由

2010-03-26 10:49:27

6717

Linux內存管理導讀

Linux 內存管理導讀 :1. 存儲層次結構和 x86存儲管理硬件（MMU） 1.1 存儲層次高速緩存(cache) 主存(main memory) 磁盤(disk) 理解存儲層次結構的根源：CPU速度和存儲器速度的差距。層次結構可

2011-11-03 22:32:33

linux內存管理

2017-10-24 11:12:13

Symbian與WinCE內存管理技術分析及對比

1 概述內存管理是操作系統的中心任務之一。內存管理模塊通常是操作系統內核的一部分，其主要任務是為操作系統內核和各執行程序組織內存，跟蹤當前內存使用狀況，在需要時為進程分配內存，使用完畢后釋放并回

2017-11-01 16:59:10

基于線段樹的內存管理方法

現有的內存管理的工作多集中在內存分配的效率上，實時性較好，但易產生內存碎片。為此，提出基于線段樹的高效內存管理方法。該方法將內存地址空間劃分為內存段，建立內存管理線段樹，基于所建立的內存管理線段

2017-12-27 14:06:42

LWIP內存管理知識匯總

一 LWIP內存管理LWIP的內存管理使用了2種方式：內存池memp和內存堆mem、。

2018-03-06 10:01:48

6486

Buffer和Cache之間區別是什么？

在集中的某一塊，所以把這塊內容放入cache后，cpu就不用在訪問內存了，這就提高了訪問速度。當然若cache中沒有cpu所需要的內容，還是要訪問內存的。

2018-04-02 10:35:06

6404

一文讀懂 Spark 內存管理

作為一個 JVM 進程，Executor 的內存管理建立在 JVM 的內存管理之上，Spark 對 JVM 的堆內(On-heap)空間進行了更為詳細的分配，以充分利用內存。同時，Spark 引入了堆外(Off-heap)內存，使之可以直接在工作節點的系統內存中開辟空間，進一步優化了內存的使用。

2018-06-04 03:44:00

816

Android內存管理機制與分析工具

在 Android 系統中有個垃圾內存回收機制，在虛擬機層自動分配和釋放內存，因此不需要在代碼中分配和釋放某一塊內存，從應用層面上不容易出現內存泄漏和內存溢出等問題，但是需要內存管理。

2018-05-11 14:44:38

4296

兩種常見的內存管理方法：堆和內存池

magic被稱為魔數，會被賦值為一個特殊的固定值，它表示了該內存塊是堆管理器管理的內存塊，可以在一定程度上檢查錯誤的內存操作。例如，若這個區域被改寫，magic的值被修改為了其它值，表明存在非法

2018-05-31 17:13:30

13099

你知道linux的cache memory？

當你讀寫文件的時候，Linux內核為了提高讀寫性能與速度，會將文件在內存中進行緩存，這部分內存就是Cache Memory(緩存內存)。即使你的程序運行結束后，Cache Memory也不會自動釋放。

2019-04-26 15:49:14

1085

你知道linux內存管理基礎及方法？

linux的內存管理采取的分頁存取機制，會將內存中不經常使用的數據塊交換到虛擬內存中。linux會不時地進行頁面交換操作，以保持盡可能多的空閑物理內存，即使并沒有什么事需要內存，linux也會交換出暫時不用的內存頁面。

2019-04-28 17:12:07

992

需要了解linux的內存管理

大家都知道，進程需要使用的代碼和數據都放在內存中，比放在外存中要快很多。問題是內存空間太小了，不能滿足進程的需求，而且現在都是多進程，情況更加糟糕。

2019-05-13 10:22:14

398

高速緩沖存儲器Cache的原理、設計及實現

程序的運行速度有很大的作用。這個介于主存和CPU之間的高速小容量存儲器稱作高速緩沖存儲器(Cache)。　　系統正是依據此原理，不斷地將與當前指令集相關聯的一個不太大的后繼指令集從內存讀到Cache

2019-04-02 14:38:30

1951

Linux 內核的文件 Cache 管理機制介紹

和作用文件 Cache 是文件數據在內存中的副本，因此文件 Cache 管理與內存管理系統和文件系統都相關：一方面文件 Cache 作為物理內存的一部分，需要參與物理內存的分配回收過程，另一方面文件

2019-04-02 14:38:49

344

cache結構與工作原理

更詳細的講，cache的結構其實和內存的結構類似，也包含地址和內容，只是cache的內容除了存的數據（data）之外，還包含存的數據的物理內存的地址信息（tag），因為CPU發出的尋址信息都是針對

2019-06-03 14:24:13

10854

干貨 | 嵌入式C語言的內存管理

很多工程師都知道，C/C++語言與其他語言不同，它需要開發者自己管理內存資源，動態內存使用不當，容易造成段錯誤或者內存泄漏，因此內存管理至關重要。

2019-07-23 14:32:42

4509

什么是內存管理？如何進行內存管理？及內存管理的方案與分析

前面已經將所有的硬件驅動實現，驗證了硬件功能。但是每一個硬件都是單獨測試的，而且并不完善。下一步，我們需要對各個驅動進行整合完善。在整合之前，需要做一些基礎工作。其中之一就是實現內存管理。什么叫內存管理呢？為什么要做內存管理？

2021-03-26 13:38:42

6311

物理內存管理內研究的內容有哪些？

內存管理總覽先籠統地總結下內存管理到底是干啥的，下面這段話摘自《現代操作系統 - 第 3 版》：內存管理的任務就是有效地管理內存，即記錄哪些內存是正確使用的，哪些內存是空閑的，在進程需要

2021-06-10 17:06:25

1240

cache對寫好代碼真的有那么重要嗎

CACHE基礎對cache的掌握，對于Linux工程師（其他的非Linux工程師也一樣）寫出高效能代碼，以及優化Linux系統的性能是至關重要的。簡單來說，cache快，內存慢，硬盤更慢

2021-07-26 15:18:58

1507

探究slab在內核內存管理和用戶態Memcached的雙重存在

很多基礎的概念，將跨越軟件的層次而存在。比如slab，對于內核人員，我們都知道slab是buddy之上的一層。因為buddy作為Linux內核最底層的內存管理器，它分配

2021-08-13 14:55:36

1242

微軟內核構架之Cache管理器

微軟內核構架之Cache管理器(實用電源技術手冊磁性元器件分冊pdf)-微軟內核構架之Cache管理器? ? ? ? ? ? ? ? ? ? ? ?

2021-08-31 16:39:58

Page Cache是什么一文帶你深入理解Linux的Page Cache

Cache 的本質是由 Linux 內核管理的內存區域。我們通過 mmap 以及 buffered I/O 將文件讀取到內存空間實際上都是讀取到 Page Cache 中。 1.2 如何查看系統

2021-10-20 14:12:41

5320

從三個方面闡述Cache

關于cache，大概可以從三個方面進行闡述：內存到cache的映射方式，cache的寫策略，cache的替換策略。映射方式內存到cache的映射方式，大致可以分為三種，分別是：直接映射

2021-11-21 11:09:50

2127

STM32內存管理

2021-12-24 19:37:16

FreeRTOS系列第8篇---FreeRTOS內存管理

本文介紹內存管理的基礎知識，詳細源碼分析見《 FreeRTOS高級篇7---FreeRTOS內存管理分析》

2022-01-26 17:56:43

Buffer和Cache介紹

設計的目的就是當上面提到的+buffers/cache表示的可用內存都已使用完，新的讀寫請求過來后，會把內存中的部分數據寫入磁盤，從而把磁盤的部分空間當做虛擬內存來使用。

2022-08-18 09:50:33

863

cache的排布與CPU的典型分布

對cache的掌握，對于Linux工程師（其他的非Linux工程師也一樣）寫出高效能代碼，以及優化Linux系統的性能是至關重要的。簡單來說，cache快，內存慢，硬盤更慢。在一個典型的現代CPU中比較接近改進的哈佛結構，cache的排布大概是這樣的：

2022-10-18 09:01:12

1195

什么是 Cache? Cache讀寫原理

由于寫入數據和讀取指令分別通過 D-Cache 和 I-Cache，所以需要同步 D-Cache 和 I-Cache，即復制后需要先將 D-Cache 寫回到內存，而且還需要作廢當前的 I-Cache 以確保執行的是 Memory 內更新的代碼

2022-12-06 09:55:56

1164

CPU Cache偽共享問題

當CPU想要訪問主存中的元素時，會先查看Cache中是否存在，如果存在（稱為Cache Hit），直接從Cache中獲取，如果不存在（稱為Cache Miss），才會從主存中獲取。Cache的處理速度比主存快得多。

2022-12-12 09:17:51

469

CPU設計之Cache存儲器

Cache存儲器也被稱為高速緩沖存儲器，位于CPU和主存儲器之間。之所以在CPU和主存之間要加cache是因為現代的CPU頻率大大提高，內存的發展已經跟不上CPU訪存的速度。在2001 – 2005

2023-03-21 14:34:53

755

Linux性能優化：Cache對性能的影響

Cache對性能的影響首先我們要知道，CPU訪問內存時，不是直接去訪問內存的，而是先訪問緩存（cache）。當緩存中已經有了我們要的數據時，CPU就會直接從緩存中讀數據，而不是從內存中讀。 CPU

2023-10-04 15:31:00

395

在組相聯cache中，用于替換cache line的算法有哪些？

LRU(Least Recently Used)算法：該算法會跟蹤每個cache line的age(年齡)情況，并在需要時替換掉近期最少使用的cache line。

2023-10-08 11:10:05

433

Python 中怎么來實現類似 Cache 的功能

cachetools，這是一個可擴展的基于內存的 Collections、Decorators 的封裝實現。因為是 Cache，那么就一定有它的頁面置換算法。根據操作系統學過的一些知識，置換

2023-10-17 10:47:24

233

Cache的原理和地址映射

在cache存儲系統中，把cache和主存儲器都劃分成相同大小的塊。主存地址由塊號B和塊內地址W兩部分組成，cache地址由塊號b和塊內地址w組成。當CPU訪問cache時，CPU送來主存地址

2023-10-31 11:21:36

453

Cache分類與替換算法

根據不同的分類標準可以按以下3種方法對Cache進行分類。 ?1）數據cache和指令cache ?● 指令cache：指令預取時使用的cache。 ?● 數據cache：數據讀寫時使用的cache

2023-10-31 11:26:31

372

Cache內容鎖定是什么

“鎖定”在cache中的塊在常規的cache替換操作中不會被替換，但當通過C7控制cache中特定的塊時，比如使某特定的塊無效時，這些被“鎖定”在cache中的塊也將受到相應

2023-10-31 11:31:21

314

Cache工作原理是什么

具有Cache的計算機，當CPU需要進行存儲器存取時，首先檢查所需數據是否在Cache中。如果存在，則可以直接存取其中的數據而不必插入任何等待狀態，這是最佳情況，稱為高速命中；當CPU所需信息不在

2023-10-31 11:34:46

403

Cache寫入方式原理簡介

提高高速緩存命中率的最好方法是盡量使Cache存放CPU最近一直在使用的指令與數據，當Cache裝滿后，可將相對長期不用的數據刪除，提高Cache的使用效率。為保持Cache中數據與主存儲器中數據

2023-10-31 11:43:37

532

Cache替換策略和Write-through介紹

Cache和存儲器一樣具有兩種基本操作，即讀操作和寫操作。當CPU發出讀操作命令時，根據它產生的主存地址分為兩種情形：一種是需要的數據已在Cache中，那么只需要直接訪問Cache，從對應單元中讀取

2023-10-31 11:48:08

560

memset會導致一大塊內存進cache嗎？

在 Arm 體系結構中，我們知道大多數的 normal memory 的配置都是 write allocation 和 read allocation 的，即當寫一塊內存或讀一塊內存的時候，如果 miss 了，那么會將該物理內存緩存到 cache 中。

2023-11-07 16:00:00

174

Linux 內存管理總結

一、Linux內存管理概述 Linux內存管理是指對系統內存的分配、釋放、映射、管理、交換、壓縮等一系列操作的管理。在Linux中，內存被劃分為多個區域，每個區域有不同的作用，包括內核空間、用戶空間

2023-11-10 14:58:37

217

已全部加載完成

搜索歷史

內存管理之為什么需要cache

評論