RDMA高性能實(shí)踐之軟硬件融合設(shè)計(jì)思路

王璞博士，達(dá)坦科技（DatenLord）聯(lián)合創(chuàng)始人。王璞博士擁有多年云計(jì)算領(lǐng)域的經(jīng)驗(yàn)，擅長(zhǎng)分布式計(jì)算、海量數(shù)據(jù)處理、大規(guī)模機(jī)器學(xué)習(xí)。曾供職Google美國(guó)總部，負(fù)責(zé)Google廣告部門海量數(shù)據(jù)處理平臺(tái)開發(fā)。2014年回國(guó)創(chuàng)業(yè)，創(chuàng)立數(shù)人云，專注容器技術(shù)在國(guó)內(nèi)的落地和推廣。2018年，數(shù)人云被收購(gòu)。2020年，創(chuàng)立達(dá)坦科技（DatenLord），致力打造新一代云原生存儲(chǔ)平臺(tái)，專注解決企業(yè)級(jí)客戶在跨云、跨數(shù)據(jù)中心方面的異構(gòu)存儲(chǔ)、數(shù)據(jù)統(tǒng)一訪問(wèn)需求。王璞擁有美國(guó)George Mason大學(xué)計(jì)算機(jī)博士學(xué)位，北大計(jì)算機(jī)專業(yè)碩士學(xué)位和北航力學(xué)專業(yè)學(xué)士學(xué)位。王璞發(fā)表數(shù)十篇論文，被引用累計(jì)上千次，并擁有多項(xiàng)云計(jì)算專利、軟著。王璞于2020年評(píng)選為騰訊云TVP。

?采用軟硬件融合的方式解決混合云場(chǎng)景下遠(yuǎn)程數(shù)據(jù)訪問(wèn)的性能問(wèn)題

?軟硬件分層思想以及軟硬件融合對(duì)系統(tǒng)設(shè)計(jì)帶來(lái)的挑戰(zhàn)

?引入計(jì)算模型概念，以及做軟硬件設(shè)計(jì)時(shí)需要考慮的點(diǎn)

?并行計(jì)算模型給軟硬件系統(tǒng)帶來(lái)性能的提升，介紹常見(jiàn)的并行計(jì)算模型

?介紹幾種常見(jiàn)的并行計(jì)算模型的硬件架構(gòu)

?軟硬件在并行場(chǎng)景下遇到的幾類協(xié)作與沖突問(wèn)題以及解決方法

?基于 RDMA 的軟件系統(tǒng)設(shè)計(jì)思路，解決高性能存儲(chǔ)數(shù)據(jù)傳輸?shù)膯?wèn)題

很高興來(lái)跟大家分享一下我們最近的工作，那天國(guó)強(qiáng)跟我說(shuō)正好今天有兩個(gè) RDMA 相關(guān)的話題，那我就換一個(gè)角度講，不再講 RDMA 的很多細(xì)節(jié)了。因?yàn)榭赡芎芏嗯笥鸦蚨嗷蛏俣加行┝私?，我主要從另外一個(gè)角度，就是硬件融合的角度，這個(gè)也是現(xiàn)在比較熱門的一個(gè)話題，可能很多朋友有軟件背景或者有硬件背景，但是可能軟硬件都搞的人確實(shí)不多，對(duì)吧？講一些我們?cè)谲浻布?CoDesign 方面的一些思考。

01 Geo-distributed Storage System

我先簡(jiǎn)單介紹一下我們?yōu)槭裁匆丬浻布诤稀Ｊ紫任覀?a target="_blank">公司是 DatenLord，我們做的是叫 Geo-distributed Storage System。怎么理解 Geo-distributed Storage System ？就是說(shuō)不同的節(jié)點(diǎn)，它是在不同的 Data Center，Data Center 之間有專線去連接（或者說(shuō)這個(gè)上面是公有云，下面是私有云，中間是專線的連接）。這樣的這種比如多 Data Center 或者所謂 multi cloud 這個(gè)場(chǎng)景，現(xiàn)在是很多企業(yè)客戶都在關(guān)注這個(gè)場(chǎng)景，所謂的多云，所謂混合云等等。

這些概念里邊一個(gè)很頭疼的問(wèn)題就是我的業(yè)務(wù)系統(tǒng)部署在不同的地方，跨 Data Center 最痛苦的就是上面的數(shù)據(jù)怎么辦？你的業(yè)務(wù)系統(tǒng)，比如現(xiàn)在都是打包成 Docker， WebFamily 或者 Serverless 這些形式去部署，部署是很靈活的，對(duì)吧？甚至現(xiàn)在像Serverless 將應(yīng)用部署在哪里提前都不知道的。但是部署之后你的應(yīng)用程序一定是會(huì)訪問(wèn)數(shù)據(jù)的，對(duì)吧？數(shù)據(jù)先天又不是那么靈活的。數(shù)據(jù)絕對(duì)不是我們想放哪就放哪，想從哪訪問(wèn)就從哪訪問(wèn)。所以現(xiàn)在數(shù)據(jù)的遠(yuǎn)程的可訪問(wèn)性，這就是對(duì)于這種多云或者混合云架構(gòu)帶來(lái)的最大的問(wèn)題，所以我們就想嘗試解決這個(gè)問(wèn)題。

就是你的業(yè)務(wù)系統(tǒng)部署在任何的地方都可以，當(dāng)然也不是任意的，肯定有所謂的親和性的部署，但是有一定的靈活性。比如你的業(yè)務(wù)可以部署在多個(gè) Data Center，部署在多個(gè)云上。下面的數(shù)據(jù)可以遠(yuǎn)程去訪問(wèn)，數(shù)據(jù)去搬遷這個(gè)事是吃力不討好的，那我們能不能讓數(shù)據(jù)的遠(yuǎn)程訪問(wèn)的性能大幅度提升。

所以就是為了解決遠(yuǎn)程數(shù)據(jù)訪問(wèn)的問(wèn)題，所以我們用軟硬件融合的方式來(lái)把它的性能大幅度提升。因?yàn)檫h(yuǎn)程數(shù)據(jù)訪問(wèn)單靠軟件是無(wú)法解決的，單靠硬件也沒(méi)辦法去搞。這是我們?yōu)槭裁匆捎密浻布诤系姆绞健?/p>

02 System Design Abstraction

接下來(lái)簡(jiǎn)單的列一下，我們從一個(gè)軟硬件系統(tǒng)的角度看我們?cè)O(shè)計(jì)的抽象層次。從上往下越來(lái)越細(xì)。上面系統(tǒng)整體的抽象層次，下面的算法層面，再往下行為級(jí)的層面（行為級(jí)這層面可能有些軟件同學(xué)可能不太理解，舉個(gè)例子，你的加減法操作，在軟件里面你不會(huì)再關(guān)心加減法操作怎么實(shí)現(xiàn)了），這三個(gè)層級(jí)軟件硬件都可以干（系統(tǒng)級(jí)、算法級(jí)和行為級(jí)）。再往下兩個(gè)層級(jí)、寄存器級(jí)和門級(jí)，當(dāng)然還往下還有晶體管級(jí)，這些層級(jí)只能硬件干了。

所以這是不同的抽象層級(jí)軟件融合，其實(shí)比較大家一直來(lái)講比較難的一個(gè)點(diǎn)就是抽象層級(jí)融合起來(lái)以后會(huì)被打破。以前我們做軟件的人不會(huì)考慮硬件這么多細(xì)節(jié)，基本上不太考慮寄存器這些東西了，但是到了硬件的跨度很大，很底層的東西我得考慮，很上層的整體系統(tǒng)我也得考慮。所以這就是軟件融合帶來(lái)的一個(gè)設(shè)計(jì)上的挑戰(zhàn)。怎么去沿著原來(lái)一致的思路？比如我做系統(tǒng)的時(shí)候，思路不能割裂（這個(gè)事一個(gè)思路，另外的事情又個(gè)思路，這是很痛苦的），我做這種大的工程的時(shí)候，希望我的思路是一致的。

03 Software Design

簡(jiǎn)單回顧一下軟件的題材，思路是比較容易理解的，我們先做架構(gòu)設(shè)計(jì)，做完架構(gòu)設(shè)計(jì)看看算法怎么回事，然后去實(shí)現(xiàn)，去測(cè)試。軟件的架構(gòu)和硬件都是不一樣的，軟件的架構(gòu)我們很多時(shí)候考慮好，比如單線程還是多線程，你是單點(diǎn)還是分布式等等。所以軟件里的一開始先考慮架構(gòu)，我們基于現(xiàn)在架構(gòu)設(shè)計(jì)，大家去開始實(shí)現(xiàn)，最后測(cè)試一下。

04 Hardware Design

硬件的設(shè)計(jì)的起點(diǎn)，就不一定再?gòu)募軜?gòu)開始了，因?yàn)橛布容^ low level ，硬件的設(shè)計(jì)的起點(diǎn)是計(jì)算模型 Model of Computation ，計(jì)算模型之后才是架構(gòu)算法等等實(shí)現(xiàn)，然后是驗(yàn)證 Verification 。

05 Model of Computation

這個(gè)計(jì)算模型是什么？這最經(jīng)典的兩個(gè)計(jì)算模型：圖靈機(jī) 和 Lambda 演算對(duì)吧？我們今天 CPU 都是圖靈機(jī) 這種模型，所以為什么前面講我們做軟件的時(shí)候不會(huì)上來(lái)先考慮你計(jì)算模型？是因?yàn)槲覀冏鲕浖蠹夷J(rèn)底下是有 CPU 的嘛。所以 Model of Computation 對(duì)于軟件來(lái)講是定死的，但對(duì)于硬件我們可以采用不同的計(jì)算模型。

雖然圖靈機(jī) 我們用了很多，但是圖靈機(jī) 也帶來(lái)了很多的問(wèn)題，比如典型我們?yōu)槭裁匆鲕浖布?Coding ？因?yàn)榇蠹野l(fā)現(xiàn)軟件很多時(shí)候處理大量數(shù)據(jù)效率并不高，因?yàn)?圖靈機(jī) 它的抽象是指令加數(shù)據(jù)，所以圖靈機(jī) 很擅長(zhǎng)的是做控制，指令都是控制對(duì)吧，指令里面帶了一點(diǎn)點(diǎn)數(shù)據(jù)。但是你做大量數(shù)據(jù)的處理的時(shí)候，其實(shí)今天看來(lái)為什么大家用 GPU 加速？其實(shí) GPU 每一個(gè) Core 還是圖靈機(jī)，但是 GPU 一堆并行，所以想做大量數(shù)據(jù)處理的時(shí)候一定要并行，只有并行才能加速。但是圖靈機(jī) 它是個(gè)串行模型，所以軟件本質(zhì)上是串行的模型。當(dāng)然今天還有多核，但多核的利用效率并不高，在并行的程度上。

所以這兩種計(jì)算模型，一個(gè)是基于是經(jīng)典的圖靈機(jī)，我們的軟件編程主要是面向過(guò)程，從 C 開始面向過(guò)程。另一個(gè) Lambda 演算，它后來(lái)衍生出來(lái)的就是函數(shù)式編程。函數(shù)式編程今天大家用的時(shí)候，起源就是 Lambda 開頭的。所以大家看軟件的發(fā)展也是。從單點(diǎn)到覺(jué)得單點(diǎn)計(jì)算能力有限，縱向擴(kuò)展 scale up 的空間是很有限的，開始做橫向擴(kuò)展 scale out，軟件不叫并行，我們叫分布式。軟件分布式的時(shí)候不好搞，這個(gè)時(shí)候借鑒了很多函數(shù)式編程。今天我們寫很多高級(jí)語(yǔ)言的時(shí)候，比如像 RUST 之類的這些語(yǔ)言的時(shí)候，里面大量的采用了函數(shù)式編程的一些特性。為什么？因?yàn)檫@是底層的 Model of Computation 帶來(lái)的不一樣， Lambda Calculus 它就沒(méi)有什么指令和數(shù)據(jù)，它靠的是縮減遞歸這些東西，所以他的演算的邏輯和圖靈機(jī)是本質(zhì)上的不一樣。

這個(gè)是我們一直在探索的，解決不同的問(wèn)題需要用不同的 Model of Computation ，這是一個(gè)很大的挑戰(zhàn)。今天基本上幾乎所有的軟件都是基于圖靈機(jī) 模型，當(dāng)然有這么多年積累，肯定是有很多好處，但是缺點(diǎn)也很明顯，處理大量的數(shù)據(jù)，處理海量數(shù)據(jù)，性能跟不上了。提升性能？從軟件的角度對(duì)吧，借鑒一些函數(shù)式編程做分布式并行，這是一個(gè)維度。但是這還不夠，這還是在偏軟件層面。下一步我們想更深入地去壓榨性能，讓硬件先天并行的。

06 Software v.s. Hardware

簡(jiǎn)單地回顧一下，軟件的時(shí)候基本上是 Model of Computation ，我們很難去改變，即便今天用這種并行編程，但它底層還是跑到 CPU 上的，CPU 的計(jì)算模型是圖靈機(jī) 模型。

當(dāng)然早期（大概上個(gè)世紀(jì)七八十年代）也有人研究基于類似 Lambda Calculus 那種所謂數(shù)據(jù)流的方式做 Data Flow 模型，也是一個(gè)當(dāng)年很熱的研究，但是后來(lái)輸給了圖形機(jī)，還是圖形機(jī) 變成了 CPU 最主流的架構(gòu)。所以硬件我們?cè)诘臅r(shí)候，根本問(wèn)題就得考慮好。軟件我們沒(méi)有人再去考慮，圖靈機(jī)模型就是一個(gè)前提假設(shè)，但硬件我可以突破圖靈機(jī)模型。

當(dāng)然今天有很多硬件，比如 Google 做 TPU( TensorProcessing Units) 的時(shí)候用的也還是圖靈機(jī)馮諾伊曼這套模型。但是它不一樣， Google 做 TPU 的時(shí)候，它的指令很少，四五條指令，指令的力度是非常非常粗的。不像 CPU x86 幾千條指令， RISC-V 都得上百條指令(這肯定有的)。

所以在硬件我們?cè)賮?lái)設(shè)計(jì)的時(shí)候，我們就必須根據(jù)你要做的計(jì)算任務(wù)，從 Model of Computation 出發(fā)，才有后面的東西。如果沒(méi)想清楚，后面在硬件上面，你做架構(gòu)，做算法，做實(shí)現(xiàn)，后面無(wú)從談起。

07 Model of Computation for Parallel

前面跟大家講了 Model of Computation 計(jì)算模型的概念。剛才講硬件先天并行，今天雖然有多核，但是軟件來(lái)源于圖靈機(jī)，它是個(gè)串行模型。我們今天所謂做性能加速，其實(shí)本質(zhì)上就是把以前串行的事該變成并行的，這樣速度就能快了。

剛才講了，硬件我們?cè)O(shè)計(jì)的時(shí)候，第一步就要考慮計(jì)算模型是什么？計(jì)算模型這個(gè)東西，其實(shí)計(jì)算機(jī)系統(tǒng)過(guò)去幾十年的研究已經(jīng)研究得很透徹了。在這舉了兩相對(duì)常見(jiàn)的，對(duì)于并行場(chǎng)景來(lái)講，我可以采用什么計(jì)算模型？這就不是圖靈機(jī)，也不是 Lambda Calculus。

第一個(gè)模型叫做 Kahn Process，名字大家不一定那么熟悉，但是其實(shí)它的理念很簡(jiǎn)單。每個(gè)節(jié)點(diǎn)是我的功能模塊，一個(gè)是生產(chǎn)者，另一個(gè)是它的消費(fèi)者。生產(chǎn)者生產(chǎn)出來(lái)這些數(shù)據(jù)或者消息傳給消費(fèi)者，消費(fèi)者可能又是別人的生產(chǎn)者。所以其實(shí)就是生產(chǎn)者消費(fèi)者問(wèn)題，只不過(guò)這些生產(chǎn)者消費(fèi)者之間的邏輯關(guān)系是一個(gè)網(wǎng)狀的，最后形成的 DAG 有向無(wú)關(guān)圖。還有很重要一點(diǎn)，這些消息中間都有個(gè)隊(duì)列給你緩沖一下。它假設(shè)是這些隊(duì)列是無(wú)限長(zhǎng)的（這是一個(gè)數(shù)學(xué)上的一個(gè)很大的假設(shè)）。所以。生產(chǎn)者來(lái)生產(chǎn)數(shù)據(jù)的時(shí)候，你隊(duì)列是無(wú)限長(zhǎng)的，所以寫操作是無(wú)阻塞的。消費(fèi)者在讀取數(shù)據(jù)的時(shí)候，接收消息的時(shí)候是有可能阻塞的，因?yàn)槟氵@個(gè)隊(duì)列有可能是空。它就是個(gè)并行的模型。

第二個(gè)模型叫做 Petri Net，可能有的朋友聽說(shuō)過(guò)，這也是很常見(jiàn)的一個(gè)并行模型。它也是生產(chǎn)者和消費(fèi)者模型，只不過(guò)它的建模方式和上面不一樣，它中間沒(méi)有所謂的緩沖隊(duì)列了，通過(guò) transition 的關(guān)系來(lái)建模。圓圈代表不同的功能模塊（代表生產(chǎn)者），黑點(diǎn)代表生產(chǎn)資料。比如生產(chǎn)者（P1）黑點(diǎn)經(jīng)過(guò) transition 或者一個(gè)動(dòng)作，它可以生產(chǎn)出兩個(gè)數(shù)據(jù)分別給到兩個(gè)消費(fèi)者（ P2 P3），這兩個(gè)數(shù)據(jù)是相同的數(shù)據(jù)，這兩個(gè)消費(fèi)者（ P2 P3）他拿分別拿到不同數(shù)據(jù)，他就可以變成生產(chǎn)者（ P2 P3）。這兩個(gè)生產(chǎn)者都得生產(chǎn)出來(lái)數(shù)據(jù)才能給到后面的消費(fèi)者（T2）。

并行模型中每一個(gè)功能模塊可以同時(shí)工作，只不過(guò)有的時(shí)候你上游數(shù)據(jù)不 ready，你這時(shí)候沒(méi)有數(shù)據(jù)讓你去處理。這種模型在于硬件建模是非常方便的，因?yàn)橛布忍炀褪遣⑿械?。但是又不是那種 free parallel，并行工作時(shí)候你要定期去 sync ，比如模塊都是生產(chǎn)者也同時(shí)都是消費(fèi)者，你什么時(shí)候有數(shù)據(jù)可以消費(fèi)，你什么什么時(shí)候生產(chǎn)數(shù)據(jù)，你下游不 ready，你生產(chǎn)出來(lái)數(shù)據(jù)會(huì)不會(huì)丟掉等等各種各樣配合的問(wèn)題。

這就是計(jì)算模型就把這些問(wèn)題給你抽象出來(lái)，大家并行的時(shí)候提升性能，但是并行不是代表大家各自去自由地去跑，一定要有中間的協(xié)同，這些就是 Model of Computation 帶來(lái)的。所以這就是我們做軟件融合系統(tǒng)的時(shí)候，一定第一步把這個(gè)問(wèn)題要想清楚，你到底解決這個(gè)問(wèn)題，它是用什么樣的一個(gè)計(jì)算模型來(lái)跟他進(jìn)行抽象。這些想明白的時(shí)候，剩下的東西就變得相對(duì)簡(jiǎn)單一些。

08 Architecture in Hardware

剛才講的是并行的計(jì)算模型，接下來(lái)對(duì)硬件的階段來(lái)講，計(jì)算模型定好之后，接下來(lái)定下硬件的架構(gòu)。常見(jiàn)的硬件架構(gòu)，我這列了幾個(gè)

?有限狀態(tài)自動(dòng)機(jī)（FSM），這是很常用的一個(gè)硬件模式，但狀態(tài)機(jī)它的一個(gè)缺點(diǎn)是什么？狀態(tài)機(jī)本質(zhì)它是個(gè)串行模型（現(xiàn)在是第一個(gè)狀態(tài)，什么時(shí)候到第二個(gè)狀態(tài)，什么時(shí)候第三個(gè)狀態(tài)）。

?流水線（Pipeline），是個(gè)很經(jīng)典的硬件的一個(gè)并行東西，只不過(guò)流水線的不同階段處理不同的數(shù)據(jù)，但它們是在一起來(lái)工作的。

?Replica，你的模塊想并行工作，怎么辦？在硬件上我也可以搞多份。比如我的加法器和乘法器，1 個(gè)不夠用，來(lái) 10 個(gè)，100 個(gè)。

?脈動(dòng)陣列（Systolic Array），是現(xiàn)在神經(jīng)網(wǎng)絡(luò)里面用的很多。它是一個(gè)陣列的方式，數(shù)據(jù)在上面不停地流動(dòng)每一個(gè)方框，這是一個(gè)處理節(jié)點(diǎn)。

所以大家看硬件設(shè)計(jì)的時(shí)候，對(duì)和軟件就很不一樣，這是常見(jiàn)的硬件的架構(gòu)圖，我們軟件不會(huì)畫這種架構(gòu)圖，因?yàn)橛布詈竽惴诺焦杵希诠杵袭嫷臇|西它是個(gè)二維結(jié)構(gòu)

09?Single-core Issue

硬件并行帶來(lái)了很大的問(wèn)題，并行模塊之前的協(xié)同是 Model of Computation 解決的問(wèn)題。

還有一個(gè)重要的問(wèn)題就是硬件并行工作，一定會(huì)導(dǎo)致沖突。例如兩個(gè)不同模塊，你去競(jìng)爭(zhēng)的寫同一個(gè)地方，或者一個(gè)讀一個(gè)寫，你希望先看到讀的結(jié)果還是先看到寫的結(jié)果等等。所以沖突管理這是并行的時(shí)候一定要解決的。

?Control 沖突，比如你指令的跳轉(zhuǎn)帶來(lái)的沖突問(wèn)題，這因?yàn)橹噶钍橇魉€，同時(shí)有多條指令在執(zhí)行，你多條指令同時(shí)執(zhí)行，帶來(lái)的沖突。

?Data 沖突，先讀后寫還是先寫后讀。

?Resource 沖突，CPU 里邊加法器，乘法器和 Cache 是有限的。那對(duì)于資源的競(jìng)爭(zhēng)沖突訪問(wèn)，這也是沖突。

10 Multi-core Issue

多核帶來(lái)的問(wèn)題可能對(duì)于軟件的同學(xué)感受比較深一些。比如多核帶來(lái)了一個(gè)很頭疼的問(wèn)題，就是內(nèi)存一致性的問(wèn)題。多個(gè)核的競(jìng)爭(zhēng)的往內(nèi)存里讀寫，這個(gè)時(shí)候你內(nèi)存的數(shù)據(jù)怎么才能稱之為是一致的？定義了幾種 Memory Order 的一致性的級(jí)別。

?順序內(nèi)存一致性 Sequential Consistency ，假設(shè)大家雖然是并行目的，但是順序地來(lái)讀寫內(nèi)存顯然不會(huì)出錯(cuò)，但是顯然 sequential 太強(qiáng)的要求了，你想要性能的時(shí)候 sequence 為了保證正確性，得是串行的來(lái)。這跟我們對(duì)性能的要求是沖突的。

?Total Store Order 就是 X86 的默認(rèn)的 Order，先 store 后 load，可以亂序。

?Multi-copy Atomic 就是 RISC-V 的默認(rèn)Order。你個(gè)核先寫的東西自己可以看見(jiàn)，如果別的核看見(jiàn)，都得能看見(jiàn)。

在借鑒 CPU 體系結(jié)構(gòu)過(guò)往的一些工程經(jīng)驗(yàn)里邊，已經(jīng)有很多實(shí)踐去來(lái)解決并行工作帶來(lái)的數(shù)據(jù)沖突的問(wèn)題。這塊是個(gè)很麻煩的問(wèn)題，我們做軟硬件設(shè)計(jì)的時(shí)候，這些問(wèn)題你都會(huì)碰到，因?yàn)槟阕鰯?shù)據(jù)處理，一旦并行的時(shí)候，這些問(wèn)題自然而就來(lái)了。而且我們做計(jì)算的時(shí)候很少碰到那種場(chǎng)景是純并行，完全不用考慮互相的協(xié)作，是很少很少的場(chǎng)景。

11 Parallel vs Distributed

不管是并行也好，還是分布式也好，是沖突的問(wèn)題，我們?nèi)ピ趺慈ソ鉀Q它。其實(shí)從軟件和硬件角度我們都有大量的工作。

?比如分布式一致性算法，像 Python 算法常用的 Raft 協(xié)議等等，它們也是在解決沖突的，只不過(guò)是在一個(gè)時(shí)間維度很大的的維度上（比如毫秒級(jí)，網(wǎng)絡(luò)傳輸都基本上都是毫秒）。

?到了內(nèi)存一致性問(wèn)題的時(shí)候，這個(gè)時(shí)候就到了一臺(tái)服務(wù)器了，這時(shí)候它的時(shí)間維度大概是微秒或者亞微秒，大幾十納秒等等。

?到了 CPU 里頭，這就是變成 Cache一致性問(wèn)題，考慮就是納秒級(jí)的問(wèn)題了。

所以其實(shí)我們?cè)谧鲆粋€(gè)復(fù)雜的系統(tǒng)（計(jì)算機(jī)系統(tǒng)或者數(shù)字系統(tǒng)）的時(shí)候，為了解決性能問(wèn)題，大量的用并行或者用分布式來(lái)做加速做肯定快。但是并行或者分布式加速帶來(lái)的問(wèn)題就是沖突。其實(shí)協(xié)作還是小問(wèn)題，沖突是最大的問(wèn)題。沖突怎么做？其實(shí)有很多現(xiàn)有的方案，只不過(guò)這些方案不一定是大家每個(gè)人都天天在研究的東西。但是當(dāng)我們下沉到軟硬件協(xié)同設(shè)計(jì)的時(shí)候，這些問(wèn)題就通通都暴露出來(lái)了，為什么會(huì)暴露出來(lái)？我們平時(shí)寫軟件，我們我有一定的抽象，但是當(dāng)我軟硬件聯(lián)合迭代的時(shí)候，這些抽象就打破了，所以你只能從根上你把這個(gè)問(wèn)題想明白。

12 Conflict Resolution in Hardware

怎么解決沖突這個(gè)問(wèn)題？其實(shí)都有很多開源的庫(kù)去解決它，每個(gè)語(yǔ)言里邊都有。硬件里面的沖突管理怎么做的？其實(shí) CPU 的體系結(jié)構(gòu)的研究里面講了不少，比如一個(gè)核里的流水線，各種 hazard 這些。

但是推而廣之，如果一個(gè)硬件系統(tǒng)，特指數(shù)字硬件 IC 這種系統(tǒng)，如果我們?cè)斓牟皇?CPU，今天做軟件融合的時(shí)候，大概率底下硬件系統(tǒng)不一定是個(gè) CPU，這個(gè)時(shí)候怎么解決這些沖突？其實(shí)借鑒的方法跟軟件的思路是一致的，本質(zhì)都是個(gè)都是并行工作帶來(lái)的沖突。所以解決問(wèn)題的思路是一致的，只不過(guò)具體的方法不一樣。

?彈性 Elastic ，軟件是很靈活很彈性的，但硬件沒(méi)那么彈性。硬件我在設(shè)計(jì)的時(shí)候，協(xié)議層面讓大家互相的消息傳遞要變成彈性，對(duì)這個(gè)消息的 delay，要對(duì) delay 變得不敏感（不要假設(shè)過(guò)多長(zhǎng)時(shí)間，我把消息發(fā)給你），這些消息的 delay 你是不可控的，什么時(shí)候消息傳遞成功等等。

?保證原子性 Atomic。比如大家我們做分布式系統(tǒng)的時(shí)候，基本上都有一個(gè)分布式一致性的，一個(gè)節(jié)點(diǎn)或者一個(gè)服務(wù)保證原子性。硬件也一樣，各種沖突我也得保證原子性，其實(shí)本質(zhì)上就是個(gè) transaction 的概念。怎么保證？就需要你底干上有一些東西，所以原子性是不好做的。比如軟件里面大家用所謂各種無(wú)鎖操作，其實(shí)本質(zhì)上就是用 CPU 直接提供原子操作。

?調(diào)度 Scheduling ，本質(zhì)通過(guò)優(yōu)先級(jí)來(lái)解決沖突問(wèn)題（沖突是不可避免的）。沖突的時(shí)候誰(shuí)優(yōu)先級(jí)更高，誰(shuí)優(yōu)先級(jí)更低。

當(dāng)然這幾個(gè)方法，可能彈性相對(duì)還好處理一點(diǎn)，有硬件協(xié)議來(lái)做，剩下的原子性，還有 Scheduling 都得我們?cè)O(shè)計(jì)硬件的都想得很清楚。

13 RDMA Software/Hardware Co-design

以我們做 RDMA 這樣一個(gè)軟件系統(tǒng)，給大家簡(jiǎn)單介紹一下我們的思路，就說(shuō)我們用 RDMA 主要是解決高性能存儲(chǔ)數(shù)據(jù)傳輸?shù)膯?wèn)題。 RDMA 本質(zhì)其實(shí)也是軟硬件的一個(gè)系統(tǒng)。我們?yōu)槭裁醋约鹤?RDMA 的硬件，是因?yàn)?RDMA 商用的卡里邊有一些不夠靈活的地方，比如 RDMA 的擁塞控制，今天基本上就兩種解決方案，一種你就買 InfiniBand 的那套商用的方案。

但是當(dāng)今數(shù)據(jù)中心我們大量用的交換機(jī)路由器還是以太網(wǎng)的。你要用 InfiniBand 的解決方案，那跟以太網(wǎng)的交換記錄器的協(xié)議都不一樣，雖然也可以融合，但是肯定不是個(gè)很優(yōu)的方案，再加上成本的考慮。

今天 RDMA 落地?cái)?shù)據(jù)中心大部分都是 RoCE 方案，所以我們也是采用 RoCE 方案， RDMA 跟以太網(wǎng)融合。但 RoCE 方案最大的問(wèn)題是什么？流量控制對(duì)他來(lái)講是黑洞。為什么這么講？你看，比如像 InfiniBand 它解決 RDMA 的流量控制問(wèn)題，他從他的鏈路層，網(wǎng)絡(luò)層，傳輸層，每一層都要去解決這個(gè)問(wèn)題。但是到 RoCE 的時(shí)候就沒(méi)那么容易了。

RoCE 是把 RDMA 的傳輸層嫁接到了 UDP 上， UDP 根本沒(méi)有任何的流量控制和擁塞控制的管理能力，只用 RDMA 的傳輸層， RDMA 傳輸層只有很少的流量控制，而且 RDMA 傳輸層沒(méi)有擁塞控制能力。今天所有的 RDMA 的流量控制和擁塞控制，都是靠額外的算法在外層去來(lái)解決這個(gè)問(wèn)題。

我們?yōu)榱藢?shí)現(xiàn)高性能傳輸?shù)臅r(shí)候，就要流量控制和擁塞控制，特別是擁塞控制。我們覺(jué)得這個(gè)問(wèn)題對(duì)我們是非常關(guān)鍵的，所以我們自己去搞硬件。而且擁塞控制這個(gè)東西，它還不是純硬件能解決的，上面還有軟件的很多東西。當(dāng)然這些問(wèn)題我們今天還沒(méi)有解決完。所以我這列的時(shí)候沒(méi)有提很多流量空投有所控制的問(wèn)題。但是如果感興趣，是網(wǎng)絡(luò)研究的一個(gè)很大的熱點(diǎn)。

我們做 RDMA 軟件和硬件的時(shí)候，其實(shí)功能模塊還是比較容易理解的。

?軟件首先就是 RDMA 的 API，因?yàn)槲覀冘浖?Rust，我們把它做了一套 RDMA 的 API 的 Rust binding forlibverbs。再一個(gè) RDMA 的測(cè)試是沒(méi)有什么開源的方案，所以我們自己搞了一套協(xié)議的一個(gè)測(cè)試框架。再一個(gè)還有驅(qū)動(dòng)的部分（硬件必然會(huì)有驅(qū)動(dòng)），今天我們看 Linux 內(nèi)核已經(jīng)開始采用 Rust，我們正在看用 Rust for Linux 怎么來(lái)做一個(gè)驅(qū)動(dòng)，前期做了一些調(diào)研，但目前還不太成熟，所以我們還沒(méi)有真正上手在干?；氐接布@端 RDMA 的傳輸層，是要硬件實(shí)現(xiàn)好。

?硬件里邊 DMA 基本是 RDMA的性能瓶頸， DMA 系統(tǒng)的最大的 delay 都是 PCIE 帶來(lái)的?；?PCIE的 DMA controller 怎么做高性能的 DMA 操作。包括現(xiàn)在新出 CXL 協(xié)議出來(lái)之后，會(huì)很大程度上解決 DMA 的性能問(wèn)題， CPU 和你的外設(shè)是在同一個(gè)地址空間，再也不需要做什么內(nèi)存的地址空間和 PCIE 地址空間 mmap 的問(wèn)題了。

?再一個(gè)就是 RoCE 方案，是用 UDP 來(lái)傳輸?shù)摹?UDP 也搬到硬件上去實(shí)現(xiàn)，需要實(shí)現(xiàn)的這些組件。

14 RDMA Software

但是在實(shí)現(xiàn)的時(shí)候，幾個(gè)底層的抽象就不一樣。軟件可能相對(duì)好想一些，你不需要考慮 Model of Computation ，你軟件是圖靈機(jī) 模型。

?軟件的架構(gòu)。這個(gè)時(shí)候我們選一個(gè)架構(gòu)，比如上面 RDMA 的這些 API 等等，我們都用協(xié)程的方式（不希望用線程這種模型，因?yàn)榫€程要內(nèi)核來(lái)調(diào)度，我們不希望做很多的上下文切換）。

?算法不太涉及， RDMA 網(wǎng)絡(luò)協(xié)議不太涉及太多算法。

?軟件我們主要是用 Rust，Rust 里面就是Rust Async。驅(qū)動(dòng)在內(nèi)核里面用 Rust for Linux 。

?測(cè)試我們主要用 Python，在 Python 里面主要用 Scapy做網(wǎng)絡(luò)包的一個(gè)測(cè)試，很常見(jiàn)的框架。

15 RDMA Hardware

硬件的設(shè)計(jì)要從 Model of Computation 開始了。因?yàn)?RDMA 它是個(gè)網(wǎng)絡(luò)協(xié)議不是 CPU ，網(wǎng)絡(luò)協(xié)議主要是做數(shù)據(jù)傳輸。

?它的 Model of Computation 我們選擇的是叫作同步數(shù)據(jù)流模型。其實(shí)它本質(zhì)上是一個(gè)前面介紹 Kahn Process的簡(jiǎn)化。最大的簡(jiǎn)化在于好我不同的生產(chǎn)者、消費(fèi)者中間之間緩沖 FIFO，我這是要管理的（它不可能是無(wú)限的，硬件沒(méi)有那么多無(wú)限的資源）。同步數(shù)據(jù)的模型它的一個(gè)很大的優(yōu)點(diǎn)就是做了比較強(qiáng)的一些假設(shè)，就是每個(gè)生產(chǎn)者每個(gè)時(shí)刻產(chǎn)生一個(gè)數(shù)據(jù)，每個(gè)消費(fèi)者每個(gè)時(shí)刻接收一個(gè)數(shù)據(jù)，這樣有了很強(qiáng)的一個(gè)假設(shè)之后，好我中間緩沖，我就可以精確地算出來(lái)了。有了同步數(shù)據(jù)流模型之后，你的這些并行之間的調(diào)度問(wèn)題也可以提前做一些安排。

?架構(gòu)層面這就是用一些硬件經(jīng)典的架構(gòu)，比如 pipeline 流水線架構(gòu)。像網(wǎng)絡(luò)數(shù)據(jù)進(jìn)來(lái)之后，很長(zhǎng)的一個(gè)流水線，我們最長(zhǎng)的流水線也大概十七八級(jí)了。狀態(tài)機(jī)也少不了。整體的并行控制等等。比如 RDMA 它不同的隊(duì)列對(duì)吧？不同的 QP(Queue Pair)，預(yù)先設(shè)好有多少個(gè) QP，靠不停地去在硬件上去復(fù)制它。

?算法不涉及。

?Implementation 的時(shí)候，我們沒(méi)有采用 Verilog 傳統(tǒng)的硬件開發(fā)語(yǔ)言。用一些比較新的 Implementation 的硬件描述，主要的考慮也在于盡可能提高開發(fā)的效率。用兩個(gè)東西，一個(gè)是 Bluespec SystemVerilog，一個(gè)是 SpinalHDL。

?測(cè)試的時(shí)候，我們現(xiàn)在做一些基于 Python 來(lái)做硬件的 Verification。當(dāng)然這兩個(gè)開發(fā)語(yǔ)言本質(zhì)它也要寫很多測(cè)試驗(yàn)證的問(wèn)題。

這個(gè)是我們整個(gè)迭代硬件的一些思考和價(jià)值。

編輯：黃飛

閱讀全文

cpu(206163) cpu(206163)
網(wǎng)絡(luò)協(xié)議(21344) 網(wǎng)絡(luò)協(xié)議(21344)
加法器(29680) 加法器(29680)
python(83366) python(83366)
RDMA(8836) RDMA(8836)

評(píng)論

相關(guān)推薦

軟硬件信息檢測(cè)工具 AIDA64 3.00.2500 綠色至尊版

本帖最后由恩哲于 2014-5-29 19:30 編輯 軟硬件信息檢測(cè)工具 AIDA64 3.00.2500 綠色至尊版對(duì)于經(jīng)常使用電腦的人來(lái)說(shuō)，有時(shí)候難免需要知道相應(yīng)的軟硬件信息。曾經(jīng)

2014-03-19 14:53:08

軟硬件分離編程的相關(guān)資料下載

嵌入式LINUX驅(qū)動(dòng)學(xué)習(xí)之14軟硬件分離編程（三）代碼舉例（通過(guò)測(cè)試程序操作LED燈 ioctl、set_bit/clear_bit）一、硬件信息驅(qū)動(dòng)程序二、代碼舉例（軟件驅(qū)動(dòng)）三、測(cè)試程序（用戶

2021-12-16 07:08:19

軟硬件協(xié)同優(yōu)化，平頭哥玄鐵斬獲MLPerf四項(xiàng)第一

的第一。這意味著在AIoT領(lǐng)域，RISC-V架構(gòu)能以極低的計(jì)算代價(jià)實(shí)現(xiàn)定制化AI功能。（圖說(shuō)：MLPerf網(wǎng)站截圖）MLPerf Tiny是目前全球IoT領(lǐng)域?qū)?b class="flag-6" style="color: red">軟硬件性能和優(yōu)化能力測(cè)試的權(quán)威AI榜單

2022-04-08 14:47:36

AVR單片機(jī)軟硬件設(shè)計(jì)教程入門篇

AVR單片機(jī)軟硬件設(shè)計(jì)教程入門篇單片機(jī)就是一臺(tái)微型電腦。麻雀雖小，五臟俱全，單片機(jī)將微型電腦的所有基本部分都集成在一片硅片上。構(gòu)成單片機(jī)的基本要素：CPU核,ROM,RAM,片上外設(shè),總線 [hide]AVR單片機(jī)軟硬件設(shè)計(jì)教程.rar[/hide]

2009-12-09 15:22:26

DNW下載的軟硬件流程是如何去完成的

DNW下載的軟硬件流程是如何去完成的？怎樣去下載DNW的軟硬件呢？有哪些下載步驟？

2021-12-24 08:01:29

FPGA研修班(sopc的軟硬件協(xié)同設(shè)計(jì))

處理器簡(jiǎn)化RTL設(shè)計(jì) ? ◆軟硬件協(xié)同設(shè)計(jì)范例 2.2.實(shí)驗(yàn)部分基于ALTERA的DE2平臺(tái)，演示各種基于NIOS II的軟硬件協(xié)同設(shè)計(jì)思路 ?&nbsp

2008-12-19 16:08:31

Kinetis平臺(tái)電容式觸摸鍵盤的軟硬件系統(tǒng)設(shè)計(jì)

電容式觸摸感應(yīng)的原理是什么Kinetis平臺(tái)電容式觸摸鍵盤的軟硬件系統(tǒng)設(shè)計(jì)

2021-03-11 06:03:57

NI軟硬件平臺(tái)在汽車ECU開發(fā)和測(cè)試中的應(yīng)用是什么？

2021-05-12 06:14:09

PSoC Creator如何簡(jiǎn)化可編程器件上的軟硬件協(xié)同設(shè)計(jì)？

PSoC Creator簡(jiǎn)化可編程器件上的軟硬件協(xié)同設(shè)計(jì)

2021-02-23 06:50:24

Purple Pi R1 開發(fā)板軟硬件資源介紹

Purple Pi R1 開發(fā)板軟硬件資源介紹*附件：Purple Pi R1 開發(fā)板軟硬件資源介紹.pdf

2022-09-06 14:27:42

[轉(zhuǎn)帖]FPGA培訓(xùn)--基于SOPC的軟硬件協(xié)同設(shè)計(jì)

;nbsp;II的軟硬件協(xié)同設(shè)計(jì)思路     ◆實(shí)驗(yàn)1：NIOS II處理器自定義指令實(shí)驗(yàn)&nbsp

2009-07-10 13:18:05

【ZDS2024 Plus示波器申請(qǐng)】機(jī)械手軟硬件調(diào)試

Plus示波器這樣的高性能示波器用于研發(fā)階段的調(diào)試。項(xiàng)目描述：2015年12月份軟硬件聯(lián)調(diào)。希望能提供該示波器給研發(fā)工程師使用。試用完成后可以退回，如性價(jià)比合適，不排除購(gòu)買。

2015-12-02 15:43:45

什么是移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題

的實(shí)踐經(jīng)驗(yàn)，來(lái)系統(tǒng)的梳理一下什么是移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題。文中涉及到的開源項(xiàng)目網(wǎng)站地址如下：開源項(xiàng)目網(wǎng)站Handsfree

2021-08-06 06:13:07

關(guān)于stm32的軟硬件設(shè)計(jì)心得

第一次接觸stm32的軟硬件設(shè)計(jì)項(xiàng)目的一點(diǎn)感受硬件設(shè)計(jì)項(xiàng)目開頭肯定是硬件設(shè)計(jì)，一般來(lái)說(shuō)，在做硬件設(shè)計(jì)之前，要先了解mcu內(nèi)部的各個(gè)功能和管腳分配情況，電源情況等等。我以前有不少設(shè)計(jì)Ti公司dsp

2022-02-14 06:50:58

分享一款不錯(cuò)的基于CPLD的臭氧電源控制系統(tǒng)的軟硬件設(shè)計(jì)

求大神分享一款不錯(cuò)的基于CPLD的臭氧電源控制系統(tǒng)的軟硬件設(shè)計(jì)

2021-04-29 06:45:15

單片機(jī)軟硬件聯(lián)合仿真解決方案

軟硬件聯(lián)合仿真，可以評(píng)估CPLD處理數(shù)據(jù)對(duì)性能的改進(jìn)。Mini Web卡軟硬件聯(lián)合仿真系統(tǒng)：軟硬件聯(lián)合仿真主要解決的問(wèn)題是系統(tǒng)功能設(shè)計(jì)與驗(yàn)證，它不解決電源、濾波電容、總線電平兼容問(wèn)題。做系統(tǒng)仿真

2008-07-17 08:56:46

單片機(jī)按鍵軟硬件設(shè)計(jì)技巧有哪些

單片機(jī)按鍵軟硬件設(shè)計(jì)技巧！

2020-04-22 14:37:38

國(guó)產(chǎn)軟硬件通用MCU可替代STM

NS32F103CBT6可軟硬通用：STM32F103C8T6、STM32F103CBT6NS32F030CBT6可軟硬件通用：STM32F030C8T6

2021-07-10 10:04:11

基于Altera FPGA的軟硬件協(xié)同仿真方法介紹

摘要：簡(jiǎn)要介紹了軟硬件協(xié)同仿真技術(shù)，指出了在大規(guī)模FPGA開發(fā)中軟硬件協(xié)同仿真的重要性和必要性，給出基于Altera FPGA的門級(jí)軟硬件協(xié)同仿真實(shí)例。關(guān)鍵詞：系統(tǒng)級(jí)芯片設(shè)計(jì)；軟硬件協(xié)同仿真

2019-07-04 06:49:19

基于SoPC的嵌入式軟硬件協(xié)同設(shè)計(jì)性能怎么優(yōu)化？

軟硬件協(xié)同設(shè)計(jì)(Hardware／Software Co-deaign)是在20世紀(jì)90年代興起的跨領(lǐng)域交叉學(xué)科。隨著超大規(guī)模集成電路制造工藝的進(jìn)步，單個(gè)芯片所能提供的晶體管數(shù)量已經(jīng)超過(guò)了大多數(shù)

2020-04-08 08:03:10

基于SoPC的狀態(tài)監(jiān)測(cè)裝置的嵌入式軟硬件協(xié)同設(shè)計(jì)

上述的軟硬件協(xié)同設(shè)計(jì)思路合理分割功能，較高性能地實(shí)現(xiàn)了在線的多路狀態(tài)監(jiān)測(cè)。2. 1 采集控制IP設(shè)計(jì)采集控制IP主要以下幾部分：采集控制邏輯，各種寄存器，數(shù)據(jù)緩存RAM塊，時(shí)間戳計(jì)數(shù)器，PLB_EMC接口

2013-01-22 16:41:56

如何使用KEIL進(jìn)行軟硬件仿真

如何使用KEIL進(jìn)行軟硬件仿真

2012-08-20 14:14:51

如何去實(shí)現(xiàn)NRF24L01狀態(tài)機(jī)的軟硬件設(shè)計(jì)呢

NRF24L01是什么？有何特點(diǎn)呢？如何去實(shí)現(xiàn)NRF24L01狀態(tài)機(jī)的軟硬件設(shè)計(jì)呢？

2021-12-16 08:04:14

如何去實(shí)現(xiàn)RCC系統(tǒng)時(shí)鐘的軟硬件設(shè)計(jì)呢

RCC時(shí)鐘樹是由哪些部分組成的？如何去實(shí)現(xiàn)RCC系統(tǒng)時(shí)鐘的軟硬件設(shè)計(jì)呢？

2021-11-10 07:20:39

如何去實(shí)現(xiàn)一種基于SoPC的軟硬件協(xié)同設(shè)計(jì)呢

什么是軟硬件協(xié)同設(shè)計(jì)呢？片上可編程系統(tǒng)SoPC是什么？如何去實(shí)現(xiàn)一種基于SoPC的軟硬件協(xié)同設(shè)計(jì)呢？基于SoPC的軟硬件協(xié)同設(shè)計(jì)有何功能呢？

2021-12-24 07:15:15

如何實(shí)現(xiàn)高性能的射頻測(cè)試解決方案

如何實(shí)現(xiàn)高性能的射頻測(cè)試解決方案NI軟硬件的關(guān)鍵作用是什么

2021-05-06 07:24:55

如何實(shí)現(xiàn)波形發(fā)生器的軟硬件系統(tǒng)設(shè)計(jì)？

本文針對(duì)高精度波形發(fā)生器的開發(fā)，進(jìn)行了以AD760為核心的波形發(fā)生器的軟硬件系統(tǒng)設(shè)計(jì)。

2021-04-12 06:54:00

如何對(duì)SOA進(jìn)行軟硬件部署

差異，對(duì)上提供統(tǒng)一的服務(wù)開發(fā)框架。涉及功能包括服務(wù)管理、網(wǎng)絡(luò)管理、通信管理、升級(jí)、診斷、日志、狀態(tài)等。本文將重點(diǎn)重軟硬件解耦的方向講解如何對(duì)SOA進(jìn)行軟硬件部署。SOA的軟件架構(gòu)設(shè)計(jì)原理如下圖表示了

2022-06-10 17:23:22

如何進(jìn)行SoPC與嵌入式系統(tǒng)軟硬件協(xié)同設(shè)計(jì)？

軟硬件協(xié)同設(shè)計(jì)是電子系統(tǒng)復(fù)雜化后的一種設(shè)計(jì)新趨勢(shì)，其中SoC和SoPC是這一趨勢(shì)的典型代表。

2019-11-11 07:35:04

尋軟硬件工程師

1、OBD II軟硬件開發(fā)、更新、升級(jí)2、OBD II車輛協(xié)議破解3、通過(guò)WIFI、藍(lán)牙模塊升級(jí)硬件端4、與手機(jī)移動(dòng)端APP接口文件對(duì)接全職待遇面議電話：***QQ：297266953聯(lián)系人：歐先生

2015-07-23 11:44:14

尋軟硬件工程師合作伙伴

1、精通OBD II軟硬件開發(fā)、更新、升級(jí)2、精通OBD II車輛協(xié)議破解3、通過(guò)WIFI、藍(lán)牙模塊升級(jí)硬件端4、與手機(jī)移動(dòng)端APP接口文件對(duì)接5、熟悉其它軟硬件的開發(fā)合作方式及利潤(rùn)分配面議。電話：***QQ：297266953聯(lián)系人：歐先生

2015-07-25 13:38:53

尋找汽車canbus協(xié)議盒開發(fā)軟硬件工程師

有過(guò)熟練canbus協(xié)議盒開發(fā)經(jīng)驗(yàn)， 軟硬件都能跟導(dǎo)航廠協(xié)調(diào)好。

2014-09-28 22:08:53

錄像DV軟硬件設(shè)計(jì)

我公司是一家錄像存儲(chǔ)軟硬件設(shè)計(jì)方案商，優(yōu)秀的團(tuán)隊(duì)，多年的開發(fā)經(jīng)驗(yàn)海思: HI3519 HI3559 HI3520D 聯(lián)詠:NT96658 NT96650 NT96655 NT96660

2017-11-27 15:38:02

怎么使用NI軟硬件開發(fā)完整的生產(chǎn)測(cè)試解決方案？

請(qǐng)問(wèn)怎么使用NI軟硬件開發(fā)完整的生產(chǎn)測(cè)試解決方案？

2021-04-15 06:45:16

怎么實(shí)現(xiàn)動(dòng)感系統(tǒng)的總體構(gòu)想及其軟硬件設(shè)計(jì)？

新型車輛模擬駕駛訓(xùn)練系統(tǒng)的組成及工作原理是什么怎么實(shí)現(xiàn)動(dòng)感系統(tǒng)的總體構(gòu)想及其軟硬件設(shè)計(jì)？

2021-05-12 06:15:16

承接單片機(jī)軟硬件開發(fā)

承接單片機(jī)軟硬件方案，主營(yíng)無(wú)線產(chǎn)品開發(fā)（GPRS,315-433M,2.4G發(fā)射接收，WIFI,ZIGBEE,藍(lán)牙），臺(tái)燈和吸頂燈燈控，工控，汽車電子，智能家居?？商峁?b class="flag-6" style="color: red">硬件設(shè)計(jì)和軟件開發(fā)。歡迎大家咨詢，有需要的請(qǐng)聯(lián)系，范先生QQ1054467185，在深圳

2016-09-10 11:55:30

支持過(guò)程級(jí)動(dòng)態(tài)軟硬件劃分的RSoC設(shè)計(jì)與實(shí)現(xiàn)

。實(shí)驗(yàn)表明該系統(tǒng)能夠較好的支持過(guò)程級(jí)的動(dòng)態(tài)軟硬件劃分,實(shí)現(xiàn)了節(jié)省資源、簡(jiǎn)化設(shè)計(jì),提高性能等目的?！娟P(guān)鍵詞】：可重構(gòu)片上系統(tǒng);;動(dòng)態(tài)軟硬件劃分;;硬件透明編程模型【DOI】：CNKI:SUN

2010-05-28 13:40:38

求一整套完整的無(wú)人機(jī)軟硬件解決方案

Paparazzi是什么？怎樣去設(shè)計(jì)一種無(wú)人機(jī)的軟硬件呢？

2021-11-11 06:46:44

求一種嵌入式Linux平臺(tái)的軟硬件的設(shè)計(jì)方案

求一種嵌入式Linux平臺(tái)的軟硬件的設(shè)計(jì)方案

2021-04-27 06:56:56

求分享NCJ29D5 EVK的軟硬件文件

如果我從 NXP 購(gòu)買 NCJ29D5 EVK。我能得到相關(guān)的軟硬件文件嗎？

2023-04-25 06:34:00

電子軟硬件項(xiàng)目承接

本帖最后由 dxb123321 于 2020-10-11 12:55 編輯本人有多年電子軟件,硬件，上位機(jī)開發(fā)經(jīng)驗(yàn)，希望找電子軟硬件開發(fā)或者上位機(jī)開發(fā)的項(xiàng)目。熟練使用多種單片機(jī)。開發(fā)過(guò)項(xiàng)目

2017-09-04 19:36:01

電感式觸摸屏軟硬件設(shè)計(jì)

求大神指點(diǎn)一下電感式觸摸屏軟硬件系統(tǒng)設(shè)計(jì)，我拿到這個(gè)題目很久了，不過(guò)一直沒(méi)有什么思路，不知道從何下手，求大神指點(diǎn)，萬(wàn)分感謝

2017-06-06 17:05:52

萌新求助，求步進(jìn)電機(jī)驅(qū)動(dòng)器軟硬件方面的知識(shí)點(diǎn)

萌新求助，求步進(jìn)電機(jī)驅(qū)動(dòng)器軟硬件方面的知識(shí)點(diǎn)

2021-10-28 08:06:50

計(jì)算機(jī)軟硬件維修精華集（夏季版）

計(jì)算機(jī)軟硬件維修精華集（夏季版）

2011-02-23 00:29:58

詳解移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題

什么是移動(dòng)機(jī)器人軟硬件系統(tǒng)問(wèn)題？移動(dòng)機(jī)器人軟硬件系統(tǒng)有哪些問(wèn)題呢？

2021-11-11 06:07:42

新域半導(dǎo)體NS32F103VBT6軟硬件通用STM

型號(hào)：NS32F103VBT6封裝：LQFP100容量：64/128KB特點(diǎn)：軟硬件通用STM32F103VBT6，不用改變?nèi)魏蔚胤?，深圳大量現(xiàn)貨庫(kù)存，擁有專業(yè)的技術(shù)支持團(tuán)隊(duì)！！NS32F103x8

2021-11-22 18:19:45

STM32F103CBT6軟硬件通用國(guó)產(chǎn)替代者NS32F103CBT6

型號(hào)：NS32F103CBT6封裝：LQFP48容量：64/128KB特點(diǎn)：軟硬件通用STM32F103CBT6，不用改變?nèi)魏蔚胤?，深圳大量現(xiàn)貨庫(kù)存，擁有專業(yè)的技術(shù)支持團(tuán)隊(duì)??！

2022-05-07 17:04:34

基于EDA的嵌入式系統(tǒng)軟硬件劃分方法

針對(duì)嵌入式系統(tǒng)軟硬件協(xié)同設(shè)計(jì)中的軟硬件劃分問(wèn)題，提出了一種基于分布估計(jì)算法的解決方案，通過(guò)將算法映射到一般結(jié)構(gòu)Gauss 網(wǎng)絡(luò)上，提高了算法的穩(wěn)定性和搜索效率。結(jié)果

2009-06-18 08:52:42

單片機(jī)測(cè)控系統(tǒng)的軟硬件平臺(tái)技術(shù)

本文探討了一種用于工業(yè)測(cè)控系統(tǒng)的單片機(jī)軟硬件綜合設(shè)計(jì)方法——軟硬件平臺(tái)技術(shù)，重點(diǎn)闡述了其基本原理、設(shè)計(jì)思想、實(shí)現(xiàn)方法，并給出了一個(gè)單片機(jī)測(cè)控系統(tǒng)軟硬件開發(fā)平臺(tái)

2009-08-13 09:38:36

基于時(shí)間Petri網(wǎng)的嵌入式系統(tǒng)軟硬件劃分方法

軟硬件劃分技術(shù)是軟硬件協(xié)同設(shè)計(jì)中的一個(gè)關(guān)鍵技術(shù)。提出將時(shí)間Petri 網(wǎng)應(yīng)用到軟硬件劃分當(dāng)中，為系統(tǒng)的性能評(píng)估提供了形式化的方法和工具。另一方面，將系統(tǒng)功能集中到Petri

2009-08-15 14:34:35

基于EDA 的嵌入式系統(tǒng)軟硬件劃分方法

基于EDA 的嵌入式系統(tǒng)軟硬件劃分方法Hardware/Software Partitioning Method Based on Estimation of Distribution 摘要：針對(duì)嵌入式系統(tǒng)軟硬件協(xié)同設(shè)計(jì)中的軟硬件劃分問(wèn)題，提

2009-12-05 16:34:56

基于SOC的USB主設(shè)備的軟硬件協(xié)同驗(yàn)證

基于SOC 的USB 主設(shè)備的軟硬件協(xié)同驗(yàn)證李棟1，李正衛(wèi)2(桂林電子科技大學(xué)通信與信息工程系，廣西桂林 541004）摘要：本文首先介紹了SOC 軟硬件協(xié)同驗(yàn)證方法及其平臺(tái)Seamless

2009-12-14 11:31:21

基于軟硬件協(xié)同設(shè)計(jì)的低功耗生理信號(hào)處理ASIC設(shè)計(jì)

摘要文主要介紹了一種采用軟硬件協(xié)同設(shè)計(jì)策略的用于生理信號(hào)處理的低功耗醫(yī)學(xué)集成芯片。軟硬件協(xié)同設(shè)計(jì)能達(dá)到性能和設(shè)計(jì)靈活性的最大化。系統(tǒng)硬件包括ARM7TDMI處理器，AHB兼

2010-06-19 10:29:54

面向HDTV應(yīng)用的音頻解碼軟硬件協(xié)同設(shè)計(jì)

摘要:該文以Dolby實(shí)驗(yàn)室的音頗AC3算法為基礎(chǔ)，研究了在RISC核Virgo上HDTV音頻解碼的軟硬件協(xié)同設(shè)計(jì)方法，提出了通過(guò)對(duì)程序關(guān)鍵子函數(shù)建模來(lái)實(shí)現(xiàn)軟硬件劃分的軟硬件協(xié)同設(shè)計(jì)方法.即

2010-07-02 21:56:54

智能脫扣器的軟硬件設(shè)計(jì)

智能脫扣器的軟硬件設(shè)計(jì) 首先介紹了智能脫扣器的硬、軟件設(shè)計(jì)及其關(guān)鍵技術(shù)，接著提出了新的數(shù)據(jù)處理方法，最后總結(jié)出一些抗干擾的措施。關(guān)鍵詞：智能脫

2009-10-29 17:41:58

804

FPGA-SoPC軟硬件協(xié)同設(shè)計(jì)

本內(nèi)容詳細(xì)介紹了FPGA-SoPC軟硬件協(xié)同設(shè)計(jì)

2011-05-09 15:59:30

嵌入式軟硬件協(xié)同設(shè)計(jì)在氣象主采集器中研究

本文介紹了嵌入式系統(tǒng)的現(xiàn)狀，分析了傳統(tǒng)嵌入式設(shè)計(jì)方法的不足和 軟硬件協(xié)同設(shè)計(jì) 方法的特點(diǎn)與優(yōu)越性，以軟硬件協(xié)同設(shè)計(jì)為方法對(duì)系統(tǒng)進(jìn)行設(shè)計(jì)，并對(duì)本論文中采用的復(fù)雜可編程

2011-08-04 17:50:33

基于USB的串行通信軟硬件設(shè)計(jì)

本文是基于USB的串行通信軟硬件設(shè)計(jì)的詳細(xì)介紹

2011-10-17 17:38:03

127

思科謀求“軟硬件一體”轉(zhuǎn)型

作為路由器和交換機(jī)領(lǐng)域的領(lǐng)導(dǎo)者，思科正在謀求在一手抓硬件的同時(shí)，另一手也開始抓軟件，實(shí)現(xiàn)“軟硬件一體”轉(zhuǎn)型。

2012-12-10 08:52:34

890

基于ARM嵌入式GPS導(dǎo)航系統(tǒng)軟硬件設(shè)計(jì)

基于ARM嵌入式GPS導(dǎo)航系統(tǒng)軟硬件設(shè)計(jì)

2015-11-19 14:36:36

基于SoC的PSTN短消息終端系統(tǒng)的軟硬件設(shè)計(jì)

基于SoC的PSTN短消息終端系統(tǒng)的軟硬件設(shè)計(jì)

2017-01-13 21:57:58

一種基于DSP的AD采樣自校正軟硬件設(shè)計(jì)_高志斌

一種基于DSP的AD采樣自校正軟硬件設(shè)計(jì)_高志斌

2017-01-14 22:34:29

Board從入門到精通（五）：軟硬件協(xié)同設(shè)計(jì)

Zynq最大的優(yōu)勢(shì)在于，同時(shí)具備軟件、硬件、IO可編程，即All Programmable。在設(shè)計(jì)Zynq過(guò)程中，同樣要建立一種意識(shí)，就是從原來(lái)單純的軟件思維（或單純的硬件思維）中解脫，轉(zhuǎn)向軟硬件協(xié)同設(shè)計(jì)的開發(fā)方法。

2017-02-11 19:01:05

2007

基于FPGA的軟硬件協(xié)同實(shí)時(shí)紙病圖像處理系統(tǒng)_齊璐

基于FPGA的軟硬件協(xié)同實(shí)時(shí)紙病圖像處理系統(tǒng)_齊璐

2017-03-19 19:07:17

USB的串行通信軟硬件設(shè)計(jì)

USB的串行通信軟硬件設(shè)計(jì)

2017-09-04 10:08:34

基于S7-1200的軟硬件要求及實(shí)例

本文檔內(nèi)容介紹了基于S7-1200的軟硬件要求及實(shí)例，供網(wǎng)友參考。

2017-09-25 18:18:09

基于FPGA的軟硬件協(xié)同測(cè)試設(shè)計(jì)影響因素分析與設(shè)計(jì)實(shí)現(xiàn)

在軟硬件的開發(fā)階段中，測(cè)試結(jié)果直接關(guān)系到這個(gè)軟硬件能否順利進(jìn)行調(diào)試應(yīng)用。其中，硬件的測(cè)試往往容易受外界因素的影響，如環(huán)境、計(jì)算機(jī)設(shè)備等，可以通過(guò)一些仿真軟件來(lái)避免外界環(huán)境的影響，但是其測(cè)試速度比較慢

2017-11-18 05:46:28

1616

軟硬件協(xié)同設(shè)計(jì)機(jī)遇與挑戰(zhàn)分析

軟硬件協(xié)同設(shè)計(jì)是指對(duì)系統(tǒng)中的軟硬件部分使用統(tǒng)一的描述和工具進(jìn)行集成開發(fā),可完成全系統(tǒng)的設(shè)計(jì)驗(yàn)證并跨越軟硬件界面進(jìn)行系統(tǒng)優(yōu)化，軟硬件協(xié)同設(shè)計(jì)是嵌入式技術(shù)發(fā)展的一大趨勢(shì)，本PPT文件

2017-11-25 03:45:01

500

如何成為一個(gè)軟硬件通吃的技術(shù)大牛？

有沒(méi)有軟硬件通吃的大牛，絕對(duì)有。這樣的大牛多是懂一點(diǎn)軟件，也懂一點(diǎn)硬件，在軟件工程師面前和人聊硬件，在硬件工

2018-03-20 16:49:32

5798

嵌入式軟硬件協(xié)同設(shè)計(jì)的過(guò)程

或多種系統(tǒng)級(jí)描述語(yǔ)言對(duì)所要設(shè)計(jì)的嵌入式系統(tǒng)的功能和性能進(jìn)行全面的描述，建立系統(tǒng)的軟硬件模型的過(guò)程。系統(tǒng)建模可以由設(shè)計(jì)者用非正式語(yǔ)言，甚至是自然語(yǔ)言來(lái)手工完成，也可以借助EDA工具實(shí)現(xiàn)。手工完成容易導(dǎo)致系統(tǒng)

2018-07-12 14:55:54

815

軟硬件融合：一個(gè)開發(fā)者的觀點(diǎn)

，而像Alexa和Fitbit這樣的專業(yè)個(gè)人設(shè)備，通過(guò)硬件和軟件構(gòu)件的結(jié)合，提升我們的日常生活品質(zhì)。也許軟硬件融合最明顯的例子應(yīng)該算是蓬勃發(fā)展的物聯(lián)網(wǎng)。物聯(lián)網(wǎng)涵蓋了從智能建筑等大規(guī)模系統(tǒng)到自主車隊(duì)這樣的小型

2018-09-18 19:18:42

526

基于ARM芯片MAX32660全程軟硬件設(shè)計(jì)實(shí)戰(zhàn)眾籌

基于ARM芯片MAX32660全程軟硬件設(shè)計(jì)實(shí)戰(zhàn)眾籌

2018-11-09 10:17:13

如何使用ADMP441評(píng)估套件的軟硬件設(shè)置

ADMP441評(píng)估套件的軟硬件設(shè)置演示。

2019-08-19 06:08:00

2415

單片機(jī)軟硬件的加密方法

總結(jié)前人的經(jīng)驗(yàn)，摸索著寫一點(diǎn)實(shí)用的方法，供大家參考：在這里不講加密算法，只討論結(jié)合軟硬件的加密方法，總結(jié)了一下大該有以下幾種：

2020-09-13 10:04:44

2876

FOC電機(jī)控制軟硬件設(shè)計(jì)及動(dòng)手實(shí)踐的資料合集免費(fèi)下載

本文檔的主要內(nèi)容詳細(xì)介紹的是FOC電機(jī)控制軟硬件設(shè)計(jì)及動(dòng)手實(shí)踐的資料合集免費(fèi)下載

2021-02-02 11:19:52

基于ESL的軟硬件劃分在AVS解碼器中的應(yīng)用

本文通過(guò)一個(gè)設(shè)計(jì)實(shí)例，介紹了基于電子系統(tǒng)級(jí)設(shè)計(jì)，的軟硬件劃分在嫡解碼器中的應(yīng)用在視頻解碼的軟硬件協(xié)同設(shè)計(jì)中，虛擬平臺(tái)在協(xié)同驗(yàn)證時(shí)指出每比特消耗的時(shí)鐘過(guò)多，需要對(duì)設(shè)計(jì)進(jìn)行修改通過(guò)合理的軟硬件劃分

2021-03-29 11:25:37

基于FPGA芯片的軟硬件平臺(tái)的使用

基于FPGA芯片的軟硬件平臺(tái)的使用

2021-07-01 09:35:17

阿里開源玄鐵RISC-V系列處理器，大幅加速RISC-V軟硬件技術(shù)融合

成熟，幫助RISC-V軟硬件技術(shù)加速融合發(fā)展，推動(dòng)創(chuàng)新落地。 ? AIoT時(shí)代，RISC-V架構(gòu)因其開放、靈活的特性，有望成為繼Intel X86、ARM后的下一代廣泛應(yīng)用的CPU架構(gòu)。但是，當(dāng)前RISC-V架構(gòu)面臨應(yīng)用碎片化、開發(fā)效率低、軟硬件適配難等問(wèn)題，軟硬件生態(tài)尚未成熟。 ? 玄鐵

2021-10-19 14:00:51

2599

遠(yuǎn)距離遙控自動(dòng)避障小車軟硬件設(shè)計(jì)資料

遠(yuǎn)距離遙控自動(dòng)避障小車軟硬件設(shè)計(jì)資料

2021-10-26 14:30:41

2021 OPPO開發(fā)者大會(huì)主會(huì)場(chǎng)：軟硬件融合技術(shù)升級(jí)

2021 OPPO開發(fā)者大會(huì)主會(huì)場(chǎng)：軟硬件融合技術(shù)升級(jí)

2021-10-27 10:43:22

1180

2021 OPPO開發(fā)者大會(huì)：軟硬件融合技術(shù)升級(jí)

2021 OPPO開發(fā)者大會(huì)：軟硬件融合技術(shù)升級(jí) 2021 OPPO開發(fā)者大會(huì)上介紹了軟硬件融合技術(shù)升級(jí)，提升開發(fā)者生產(chǎn)效率。責(zé)任編輯：haq

2021-10-27 14:53:42

2356

專業(yè)軟硬件開發(fā)

TEL18622454561 QQ343924663多年來(lái)一直從事軌道交通、鐵路專用電子設(shè)備開發(fā)，做軟硬件開發(fā)培訓(xùn)，小批量委托生產(chǎn)，曾做過(guò)很多項(xiàng)目，單片機(jī)軟件開發(fā)及硬件設(shè)計(jì)的經(jīng)驗(yàn)豐富，具體項(xiàng)目信息

2021-12-16 16:51:48

Type-c設(shè)計(jì)及PD相關(guān)軟硬件實(shí)現(xiàn)詳解

Type-c設(shè)計(jì)及PD相關(guān)軟硬件實(shí)現(xiàn)詳解，

2022-02-23 09:53:38

軟硬件協(xié)同設(shè)計(jì)是系統(tǒng)芯片的基礎(chǔ)設(shè)計(jì)方法學(xué)

軟硬件協(xié)同仿真驗(yàn)證是對(duì)軟硬件功能設(shè)計(jì)的正確性及性能進(jìn)行驗(yàn)證和評(píng)估。傳統(tǒng)設(shè)計(jì)中，硬件和軟件通常是分開獨(dú)立開發(fā)設(shè)計(jì)的，到系統(tǒng)設(shè)計(jì)后期才將軟硬件兩部分集成到一起進(jìn)行驗(yàn)證。

2022-08-12 11:28:33

2693

EMC測(cè)試認(rèn)證軟硬件設(shè)計(jì)指導(dǎo)

電子發(fā)燒友網(wǎng)站提供《EMC測(cè)試認(rèn)證軟硬件設(shè)計(jì)指導(dǎo).pdf》資料免費(fèi)下載

2022-09-22 11:25:27

為什么要從“軟硬件協(xié)同”走向“軟硬件融合”？

軟件和硬件需要定義好交互的“接口”，通過(guò)接口實(shí)現(xiàn)軟硬件的“解耦”。例如，對(duì)CPU來(lái)說(shuō)，軟硬件的接口是指令集架構(gòu)ISA：ISA之下的CPU處理器是硬件，指令集之上的各種程序、數(shù)據(jù)集、文件等是軟件。

2022-12-07 14:23:15

1852

虛擬機(jī)和容器的性能損耗評(píng)測(cè)

本文選自極術(shù)專欄“軟硬件融合”，授權(quán)轉(zhuǎn)自微信公眾號(hào)軟硬件融合，本篇將詳細(xì)評(píng)測(cè)虛擬機(jī)和容器的性能損耗在相關(guān)的應(yīng)用場(chǎng)景下的性能對(duì)比。

2023-05-16 09:38:15

6187

浪潮云海新一代超融合發(fā)布全棧RDMA煥發(fā)優(yōu)質(zhì)性能

5月30日，浪潮云海正式發(fā)布新一代 InCloud Rail G7 系列超融合一體機(jī)，新品基于全棧 RDMA協(xié)議的軟硬件一體化設(shè)計(jì)，發(fā)布現(xiàn)場(chǎng)實(shí)測(cè)3節(jié)點(diǎn)性能超百萬(wàn) IOPS，是傳統(tǒng)方案的數(shù)倍。

2023-06-05 09:20:38

578

軟硬件融合的概念和內(nèi)涵

跟很多朋友交流，當(dāng)提到軟硬件融合的時(shí)候，他們會(huì)這么說(shuō)：“軟硬件融合，難道不是顯而易見(jiàn)嗎？我感覺(jué)在二三十年前就已經(jīng)有這個(gè)概念了?！痹谒麄兊南敕ɡ?，其實(shí)：軟硬件融合等同于軟硬件協(xié)同，甚至等同于軟硬件結(jié)合。他們混淆了軟硬件結(jié)合、軟硬件協(xié)同和軟硬件融合的概念。

2023-10-17 14:36:24

472

KubeCASH：基于軟硬件融合的容器管理平臺(tái)

、CSI、CDI等接口都奉行一個(gè)重要的原則：“不做事，就不會(huì)犯錯(cuò)”。K8S可以理解成嵌于整個(gè)軟硬件堆棧的一個(gè)薄層，僅僅提供硬件到容器環(huán)境的一個(gè)接入。至于具體的軟硬件交互接口和機(jī)制、硬件加速器的系統(tǒng)架構(gòu)和實(shí)現(xiàn)、如何把硬件性能和性能價(jià)值充分發(fā)揮出來(lái)的計(jì)算框架，以及硬件加速原生的軟件架構(gòu)規(guī)范等等，它統(tǒng)統(tǒng)不管。

2024-01-08 10:16:54

290

已全部加載完成

搜索歷史

RDMA高性能實(shí)踐之軟硬件融合設(shè)計(jì)思路

評(píng)論