本文結(jié)合國(guó)內(nèi)主流SSD控制器/盤的研發(fā)中心在購(gòu)買PCIe Gen 4&5協(xié)議分析儀過(guò)程中最關(guān)心的點(diǎn)闡述一下如何買到一臺(tái)高效、可用、高性價(jià)比的PCIe協(xié)議分析儀,這些公司包括浪潮、華芯、大普,Memblaze,YMTC,Longsys,Maxio, Sage Micro等等,下面按照關(guān)心的重要程度依次列出這些點(diǎn)供大家參考。
提示:對(duì)于Saniffer公司發(fā)布的Gen 4&5 NVMe SSD測(cè)試工具白皮書感興趣的朋友,可以訪問(wèn)saniffer官方網(wǎng)站下面的連接下載最新更新的“PCIe Gen 4&5NVMe SSD測(cè)試環(huán)境搭建和常用工具圖解 4.0”文檔。如果有其它問(wèn)題可以點(diǎn)擊本文左下角的“閱讀原文”留下你的聯(lián)系方式。
https://www.saniffer.com/cn/downloads/
1.信號(hào)問(wèn)題
該問(wèn)題是判斷一個(gè)分析儀是否可用的一個(gè)基本問(wèn)題,業(yè)內(nèi)估計(jì)沒(méi)有公司愿意花上百萬(wàn)或者幾百萬(wàn)人民幣購(gòu)買一臺(tái)PCIe分析儀后發(fā)現(xiàn)在很多場(chǎng)景下無(wú)法使用。不幸的是,我們發(fā)現(xiàn)傳統(tǒng)架構(gòu)的PCIe Gen4&5分析儀普遍存在這種問(wèn)題甚至更嚴(yán)重。我們建議公司在做最終決定前一定要在真實(shí)環(huán)境中試用PCIe分析儀,這樣就可以大大避免購(gòu)買以后出現(xiàn)問(wèn)題。下面的問(wèn)題是傳統(tǒng)PCIe分析儀在真實(shí)環(huán)境中經(jīng)常出現(xiàn)的問(wèn)題
–完全抓不到任何數(shù)據(jù)
–待測(cè)系統(tǒng)無(wú)法啟動(dòng)
–待分析問(wèn)題癥狀消失
–信號(hào)不好,抓到各種錯(cuò)誤
碰到上述問(wèn)題以后,傳統(tǒng)PCIe分析儀需要非常復(fù)雜的calibration,用戶工程師一般無(wú)法搞定,其實(shí),即便原廠R&D設(shè)計(jì)工程師使用內(nèi)部專用工具軟件進(jìn)行信號(hào)的calibration校準(zhǔn)也不一定搞好,因?yàn)檫@些問(wèn)題大多由于其interposer內(nèi)部設(shè)計(jì)造成的。
SerialTek公司的PCIe Gen 4&5協(xié)議分析儀設(shè)計(jì)具備自適應(yīng)的EQ能力,并且當(dāng)PCIe鏈路特性發(fā)生變化的時(shí)候(例如Hotplug或者NSSR)分析儀可以動(dòng)態(tài)調(diào)整,其interposer采用昂貴的高端analog passthrough的模擬芯片將upstream和downstream信號(hào)導(dǎo)入分析儀,避免了上述這些問(wèn)題的出現(xiàn),也無(wú)需用戶進(jìn)行信號(hào)校準(zhǔn)(Calibration-free)。
我們來(lái)看一下業(yè)內(nèi)知名的芯片公司Phison的首席工程師是如何來(lái)評(píng)價(jià)SerialTek的這一創(chuàng)新性的專利技術(shù)- 信號(hào)高保真SI-FI (Signal Fidelity)。
I’ve been using protocol analyzers for 31 years and PCIe analyzers and interposers extensively for the past 5 years. We use them for important assignments that affect revenue and customer satisfaction,” said John Wehman, Principal Engineer at Phison Technology. “With other analyzers I have had to abandon my testing many times, because I could not find a good quality signal lock. SerialTek’s Kodiak analyzer and SI-Fi interposers have changed all that. I have 100% confidence in Kodiak’s ability to achieve lock and give me the trace I need to do my job. Kudos to Ellisys and SerialTek for creating not only an electrically reliable platform, but the actual mechanical hardware itself is beautiful.
視頻一 SerialTek PCIe Gen 4 analyzer實(shí)物簡(jiǎn)介
2.解碼速度
該問(wèn)題是判斷一個(gè)分析儀問(wèn)題診斷效率是否高效的重要參考。不論是計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、SSD還是其它芯片開(kāi)發(fā)、驗(yàn)證過(guò)程中會(huì)越來(lái)越多依賴PCIe分析儀分析各種各樣的問(wèn)題,尤其在產(chǎn)品驗(yàn)證的后半期,很多問(wèn)題的復(fù)現(xiàn)本身就需要花費(fèi)很長(zhǎng)時(shí)間,如果對(duì)于抓取大量數(shù)據(jù)進(jìn)行解碼分析再需要花費(fèi)幾個(gè)小時(shí)甚至1~2天,相信工程師不會(huì)有那么多時(shí)間加班。
除了SerialTek之外,業(yè)內(nèi)的傳統(tǒng)PCIe分析儀內(nèi)部都沒(méi)有任何處理能力,抓取到數(shù)據(jù)以后,需要通過(guò)下面兩個(gè)步驟才能看到解碼 – 1)分析儀停止抓取數(shù)據(jù)后,安裝在用戶電腦的協(xié)議分析儀軟件開(kāi)始將數(shù)據(jù)從分析儀BUFFER傳輸?shù)诫娔X;2)傳輸完畢后解碼。所以,我們看到解碼嚴(yán)重依賴用戶的電腦,當(dāng)然電腦單核CPU配置性能高一些,內(nèi)存大一些可能效率稍高一點(diǎn),傳統(tǒng)分析儀軟件都是單線程,多核CPU無(wú)法發(fā)揮作用。
傳統(tǒng)分析儀的實(shí)際測(cè)試結(jié)果:抓取32G buffer,傳輸時(shí)間4+小時(shí),解碼時(shí)間4+小時(shí),總計(jì)等待8小時(shí)才可以分析這些解碼。如果抓取128G Buffer,考慮到電腦的處理能力各方面,這個(gè)并不是簡(jiǎn)單4倍的關(guān)系,估計(jì)需要2整天時(shí)間才可以解碼完畢(如果電腦不死機(jī)的話),如果有條件大家可以測(cè)試一下。
SerialTek分析儀采用高性能服務(wù)器架構(gòu),內(nèi)置12 CORE高性能CPU, 使用標(biāo)準(zhǔn)Linux系統(tǒng),配置64G memory供Linux使用,協(xié)議分析儀軟件服務(wù)端采用多線程運(yùn)行在12 CORE上。所以,分析儀一旦停止抓取數(shù)據(jù)后,CPU通過(guò)內(nèi)置兩條Gen 3 x16總線從upstream (72GB buffer)和downstream(72GB buffer)分析儀板卡的buffer里面將數(shù)據(jù)取回進(jìn)行分析。
基本1秒鐘即可解碼所有的數(shù)據(jù),工程師可以用鼠標(biāo)直接拖動(dòng)到最后一行解碼進(jìn)行問(wèn)題定位和分析,不論你抓取的是36G, 72G,還是128GB數(shù)據(jù),也不論解碼是2000萬(wàn)行解碼還是2億行。如果簡(jiǎn)單查看一下覺(jué)得不是自己需要的數(shù)據(jù),下一秒鐘即可start capture重新開(kāi)始抓取數(shù)據(jù)。
當(dāng)然,可能有人問(wèn)為什么需要抓取這么大的buffer的數(shù)據(jù)呢?幾個(gè)原因如下:
–在高速傳輸?shù)那闆r下出現(xiàn)性能不穩(wěn)定問(wèn)題或者功能問(wèn)題
–問(wèn)題很難復(fù)現(xiàn),可能幾天出現(xiàn)一次,或者有的時(shí)間一天出現(xiàn)幾次,無(wú)法根據(jù)癥狀現(xiàn)象設(shè)置trigger條件,只能人工等待出現(xiàn)問(wèn)題的時(shí)候給工程師預(yù)留出足夠的反應(yīng)時(shí)間來(lái)停止抓包,這樣就可以將問(wèn)題發(fā)生時(shí)候的數(shù)據(jù)保留在分析儀內(nèi)部buffer,因?yàn)檎G闆r下buffer滿了會(huì)loopback環(huán)回從而沖掉之前抓取的數(shù)據(jù)。
3.存儲(chǔ)速度
有時(shí)候?qū)τ谧ト〉降臄?shù)據(jù)進(jìn)行初步分析后覺(jué)得有必要進(jìn)一步分析,或者需交給其它同事分析,這個(gè)時(shí)候需要存儲(chǔ)該數(shù)據(jù)(專業(yè)術(shù)語(yǔ): trace文件)。存儲(chǔ)速度也是衡量分析儀是否高效的一個(gè)重要指標(biāo)。
傳統(tǒng)PCIe分析儀對(duì)于抓取的數(shù)據(jù)進(jìn)行存儲(chǔ)的前提條件是先傳輸?shù)降诫娔X,解碼完畢,然后才可以通過(guò)菜單將trace存儲(chǔ)在電腦本地的某個(gè)目錄下面。一般這個(gè)時(shí)候可能還要重新傳輸一遍數(shù)據(jù),所以非常慢。以上面提到的8小時(shí)解碼的分析儀為例,如果存儲(chǔ)該trace文件估計(jì)需要至少等待8個(gè)小時(shí)。
SerialTek Gen 4&5協(xié)議分析儀保存144G BUFFER僅需要6.5min, 大大提高了效率。其本質(zhì)原因在于分析儀架構(gòu)采用高端服務(wù)器架構(gòu),和傳統(tǒng)的嵌入式架構(gòu)的PCIe協(xié)議分析儀完全不一樣,SerialTek分析儀內(nèi)置了最多4塊Samsung M.2 NVMe SSD,所有存儲(chǔ)書的時(shí)候無(wú)需導(dǎo)出到電腦,直接將buffer寫到內(nèi)置的M.2 NVMe SSD閃存盤,所以速度非常塊。
4.問(wèn)題復(fù)現(xiàn)時(shí)遇到解碼全錯(cuò)
傳統(tǒng)PCIe Gen 4/5分析儀在實(shí)際使用之前必須進(jìn)行經(jīng)過(guò)一個(gè)“抓取上電過(guò)程”的冗長(zhǎng)步驟,否則,希望等到問(wèn)題出現(xiàn)的時(shí)候再來(lái)接入分析儀嘗試抓數(shù)據(jù)將無(wú)法解碼,具體分為下面三個(gè)步驟:1) 啟動(dòng)協(xié)議分析儀,打開(kāi)協(xié)議分析軟件,連接分析儀,開(kāi)始抓取數(shù)據(jù);2)啟動(dòng)待測(cè)環(huán)境;3)停止分析儀抓取數(shù)據(jù),load數(shù)據(jù)到分析儀軟件得到解碼所需要的參數(shù)信息,該信息將存儲(chǔ)在該電腦的分析軟件,以此作為后續(xù)抓取數(shù)據(jù)解碼的依據(jù)。
所以,上述設(shè)計(jì)的缺陷顯而易見(jiàn),所有使用過(guò)這類傳統(tǒng)PCIe分析儀的工程師都會(huì)碰到這樣“惱人”的問(wèn)題,即,為了復(fù)現(xiàn)某個(gè)問(wèn)題需要反復(fù)重啟系統(tǒng),經(jīng)過(guò)幾十次甚至上百次的掉電、上電總算問(wèn)題復(fù)現(xiàn)了,結(jié)果發(fā)現(xiàn)分析儀也抓到數(shù)據(jù)了, 但是解碼全部錯(cuò)誤。原因就在于問(wèn)題復(fù)現(xiàn)時(shí)候的某些參數(shù),例如BAR地址,register,或者PCIe speed或者width等和初始的參數(shù)對(duì)比發(fā)生了變化,但是分析軟件仍然用之前暫存的參數(shù)進(jìn)行解碼,結(jié)果解碼全部錯(cuò)誤。
SerialTek是業(yè)內(nèi)唯一通過(guò)分析儀硬件實(shí)時(shí)監(jiān)控每次待測(cè)系統(tǒng)加電協(xié)商的參數(shù)的分析儀,所以,使用SerialTek協(xié)議分析儀根本不存在需要提前連接軟件抓取開(kāi)機(jī)上電過(guò)程這個(gè)步驟,任何時(shí)候需要抓取的時(shí)候再打開(kāi)分析軟件連接分析儀都可以直接抓取,并且解碼不會(huì)出錯(cuò)。這個(gè)功能也是Intel, AMD, Seagate, WDC,Micron, MS, Apple, Broadcom以及國(guó)內(nèi)知名公司一定要購(gòu)買SerialTek的重要原因之一。
5.“遠(yuǎn)程分析”和“遠(yuǎn)程協(xié)作”
現(xiàn)在大多數(shù)產(chǎn)品開(kāi)發(fā)公司一般都有多個(gè)站點(diǎn),國(guó)內(nèi)公司一般也會(huì)在上海、北京、深圳、成都、蘇州、杭州等城市有多個(gè)研發(fā)中心,跨國(guó)公司除了在上述城市有辦公室之外,還會(huì)在美國(guó),加拿大,臺(tái)灣甚至日本設(shè)立研發(fā)中心,那么這種情況下,對(duì)于動(dòng)輒抓取到的100GB trace文件如何分享和分析呢?傳統(tǒng)PCIe分析儀由于架構(gòu)固有的限制,必須把trace文件發(fā)給另一方才可以分析。使用SerialTek則沒(méi)有這些問(wèn)題,幾個(gè)典型場(chǎng)景如下:
–辦公室內(nèi)部的分析和協(xié)作 – 工程師A退出軟件,工程師B連接分析儀,直接打開(kāi)尚在buffer里面的數(shù)據(jù)秒解分析,或者打開(kāi)A已經(jīng)存儲(chǔ)在分析儀內(nèi)部閃存盤上面的trace文件分析,時(shí)間也是秒解。
–跨辦公室的分析和協(xié)作 – 同上,只不過(guò)工程A和B分布在兩個(gè)不同的辦公室Site,兩個(gè)辦公室可能都在國(guó)內(nèi),也可能跨國(guó)。但是解碼速度也是秒解碼,因?yàn)锽無(wú)論是打開(kāi)分析儀內(nèi)部buffer數(shù)據(jù)還是分析儀內(nèi)部閃存盤的數(shù)據(jù),分析儀本身只是將界面?zhèn)鬏數(shù)紹的軟件界面顯示,網(wǎng)絡(luò)帶寬占用只有10~20BPS,非常低。
–遠(yuǎn)程辦公– 由于目前全球covid-19仍然肆虐,很多時(shí)候工程師需要遠(yuǎn)程辦公,公司僅在辦公室安排少量的工程師或者實(shí)驗(yàn)室技工協(xié)助搭建環(huán)境等工作。工程師A或者B只要通過(guò)VPN連接到公司內(nèi)網(wǎng),即可實(shí)現(xiàn)遠(yuǎn)程操作分析儀抓包分析和多站點(diǎn)協(xié)作。
6.消費(fèi)級(jí)M.2 SSD低功耗分析
當(dāng)前,M.2 NVMe SSD在筆記本,Pad, GPS等消費(fèi)類產(chǎn)品以及臺(tái)式機(jī)(游戲機(jī))以及服務(wù)器啟動(dòng)盤上獲得了廣泛的應(yīng)用,但是,傳統(tǒng)PCIe Gen 4/5分析儀由于設(shè)計(jì)的原因?qū)е翸.2 SSD低功耗在分析時(shí)會(huì)出現(xiàn)丟包問(wèn)題。SerialTek在硬件底層上解決了困擾用戶抓取低功耗碰到的這些問(wèn)題。
7.企業(yè)級(jí)U.2/U.3/Single Port/Dual Port四合一分析
現(xiàn)在國(guó)內(nèi)的企業(yè)級(jí)SSD廠商為了打入數(shù)據(jù)中心市場(chǎng),有的公司從去年起即啟動(dòng)U.3 NVMe SSD研發(fā),當(dāng)然主流的接口仍然是U.2。目前傳統(tǒng)PCIe分析儀需要用戶分別購(gòu)買U.2和U.3 interposer,價(jià)格非常昂貴。SerialTek分析儀提供“四合一”interposer,即一個(gè)interposer可以自適應(yīng)支持U.2/U.3/Single Port/Dual Port這四種組合的SSD,并且,一臺(tái)分析儀非常方便地抓取dual port ssd的兩個(gè)port的數(shù)據(jù)。
8.斷網(wǎng)續(xù)傳
傳統(tǒng)PCIe分析儀的網(wǎng)線如果斷掉,即便0.1ms,再接回去網(wǎng)線也會(huì)無(wú)法使用,只能分析儀重啟然后重新抓取數(shù)據(jù)才可儀;這個(gè)是由于分析儀內(nèi)部使用精簡(jiǎn)OS無(wú)法維護(hù)網(wǎng)絡(luò)狀態(tài)導(dǎo)致。SerialTek分析儀使用標(biāo)準(zhǔn)CentOS完全解決了這個(gè)問(wèn)題。該功能非常利好AE/FAE工程師外出調(diào)試問(wèn)題,當(dāng)工程師設(shè)置好觸發(fā)條件開(kāi)始抓取數(shù)據(jù)以后即可斷開(kāi)電腦離開(kāi)現(xiàn)場(chǎng),需要的時(shí)候可以接回電腦即可查看解碼數(shù)據(jù)。
9.對(duì)某個(gè)特定盤進(jìn)行抓包或者命令觸發(fā)
現(xiàn)在有很多測(cè)試場(chǎng)景抓取的數(shù)據(jù)中有多個(gè)盤的流量,例如,如果使用cable interposer串接在switch卡和背板之間,或者使用slot interposer分析PCIe Gen 4 x16 Host Card連接4塊U.2 SSD的場(chǎng)景,那么分析儀就可以“看見(jiàn)”所有掛接在背板或者卡上面的SSD的流量,傳統(tǒng)分析儀無(wú)法區(qū)分抓取某個(gè)盤的流量,或者僅觸發(fā)某個(gè)盤的特定PCIe packet或者NVMe command,SerialTek 分析儀很好地解決了該問(wèn)題,通過(guò)支持基于BDF以及queue等參數(shù)實(shí)現(xiàn)抓包過(guò)濾或者觸發(fā)。
10.如何解決不同版本沖突帶來(lái)的煩惱?**
一般情況下,公司里面都是有多名工程師會(huì)使用分析儀抓取數(shù)據(jù),有些公司還會(huì)經(jīng)常將分析儀在多個(gè)站點(diǎn)間調(diào)度使用,這就會(huì)帶來(lái)一個(gè)版本沖突的問(wèn)題。PCIe分析儀由于會(huì)定期發(fā)布一些版本解決一些產(chǎn)品bug或者增加一些新的功能,假如某工程師A下載了一個(gè)新的協(xié)議分析儀軟件版本,當(dāng)他安裝好打開(kāi)軟件后由于和分析儀內(nèi)部的firmware不匹配,所以需要升級(jí)分析儀。
如果下次另外一個(gè)工程師B使用該分析儀,由于他仍然使用上一個(gè)軟件版本,所以和拿到的分析儀內(nèi)部的firmware版本不匹配,所以他如果要使用的話只能將分析儀firmware降級(jí)。然后如果A再拿去又不得不升級(jí),如此反復(fù)會(huì)搞得版本維護(hù)非常雜亂,并且會(huì)導(dǎo)致潛在風(fēng)險(xiǎn),因?yàn)榉治鰞xfirmware升級(jí)過(guò)程中萬(wàn)一斷電會(huì)導(dǎo)致不得不回原廠返修。
SerialTek Gen 5分析儀使用Web界面管理,不再使用協(xié)議分析客戶端軟件的傳統(tǒng)方式。任意工程師通過(guò)Web將版本升級(jí)后,其他工程師登錄Web界面使用,就不存在版本反復(fù)升級(jí)、降級(jí)帶來(lái)的煩惱以及風(fēng)險(xiǎn)問(wèn)題。
編輯:jq
-
PCIe
+關(guān)注
關(guān)注
15文章
1262瀏覽量
83202 -
SSD控制器
+關(guān)注
關(guān)注
1文章
12瀏覽量
11539 -
華芯
+關(guān)注
關(guān)注
0文章
7瀏覽量
2183 -
WDC
+關(guān)注
關(guān)注
0文章
4瀏覽量
3301
原文標(biāo)題:業(yè)界主流SSD研發(fā)中心選擇PCIe Gen 4&5分析最關(guān)心哪幾個(gè)點(diǎn)
文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
用TPA3136典型應(yīng)用電路波形異常,從哪幾個(gè)方面尋找問(wèn)題?
TAS2505-Q1的MCLK, WCLK, DIN, BCLK這幾個(gè)PIN,對(duì)應(yīng)的mcu這邊的哪幾個(gè)pin?
美光研發(fā)出世界首款PCIe Gen6 SSD
Prodigy Technovations推出功能強(qiáng)大的PCIe Gen5協(xié)議分析儀
![Prodigy Technovations推出功能強(qiáng)大的<b class='flag-5'>PCIe</b> <b class='flag-5'>Gen5</b>協(xié)議<b class='flag-5'>分析</b>儀](https://file1.elecfans.com//web2/M00/FF/EF/wKgaomamufeADP_zAAD0llVD_N4136.jpg)
一個(gè)成熟的PCBA設(shè)計(jì)通常包含哪幾個(gè)方面?
HighPoint發(fā)布商用PCIe Gen5解決方案,最大可達(dá)960TB SSD容量
高性能NVMe主機(jī)控制器,Xilinx FPGA PCIe 3
鎧俠:PCIe Gen5 SSD襲卷2024年,閃存技術(shù)創(chuàng)新,加速生成式AI落地
![鎧俠:<b class='flag-5'>PCIe</b> <b class='flag-5'>Gen5</b> <b class='flag-5'>SSD</b>襲卷2024年,閃存技術(shù)創(chuàng)新,加速生成式AI落地](https://file1.elecfans.com/web2/M00/D0/DA/wKgaomYiN7aANmOTAAe1bqwg30k173.png)
Xilinx FPGA高性能NVMe SSD主機(jī)控制器,NVMe Host Controller IP
引領(lǐng)PCIe Gen5 SSD部署,鎧俠在CFMS展出哪些旗艦產(chǎn)品?
![引領(lǐng)<b class='flag-5'>PCIe</b> <b class='flag-5'>Gen5</b> <b class='flag-5'>SSD</b>部署,鎧俠在CFMS展出哪些旗艦產(chǎn)品?](https://file1.elecfans.com/web2/M00/C6/82/wKgaomYA04uADsWgAA0zNwmnbas877.png)
評(píng)論