吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Xilinx DSP slices 實現 SDF 流水 FFT Core

C29F_xilinx_inc ? 來源:互聯網 ? 作者:佚名 ? 2017-09-19 11:07 ? 次閱讀

背景:

快速傅里葉變換(FFT)在雷達、通信電子對抗等領域有廣泛應用。近年來隨著現場可編程門陣列(FPGA)的飛速發展,與DSP技術相比,由于其并行信號處理結構,使得FPGA能夠很好地適用于高速信號處理系統,但是,由于Altera公司研制的FFT IP核,價錢昂貴,不適合大規模應用,在特定領域中,設計適合于自己領域需要的FFT處理器是較為實際的選擇,下面將關注一些關于流水級FFT處理器的一些最新發展。

SDF FFT Core → FPGA DSP slice:

近期,在IEEE VLSI系統專欄學報處有一篇12頁的題為“Efficient FPGA Mapping of Pipeline SDF FFT Cores”的新論文即將被發表(在IEEE Xplore可見)。而在這篇論文中作者就如何將一個SDF(single-path delay feedback單路延遲反饋)FFT核映射到Xilinx的全可編程芯片內部的DSP48 slices的可編程邏輯及其他可用的存儲資源上進行了深入周密的細節性討論。盡管這篇論文主要是針對Virtex-4和Virtex-6系列FPGA進行討論的,但是作者也明確指出,由于Xilinx 7系列和UltraScale/UltraScale+ 系列FPGA與Virtex-6使用相同的slice 架構,所以這種映射其實很容易被推廣的。

在論文中,作者詳細闡述了Xilinx的產品,主要是從Virtex-4 FPGA開始到Xilinx后來的所有全可編程芯片等多代產品內部的DSP48 slices的一個發展過程:首先,Virtex-4 FPGA系列包含一18X18bit乘法器和48bit累加器的XtremeDSP(DSP48);之后的Virtex-6系列FPGA加入了25x18bit乘法器和48bit累加器的DSP48 slices ;較新的7系列FPGA和Zynq-7000系列SoC則內嵌了25x18bit乘法器和48bit累加器的DSP48 slices;而最強的UltraScale/UltraScale+系列FPGA則包括了27x18bit乘法器和48bit加法器的DSP48E2。除此之外,在Xilinx每一代FPGA的DSP48 slices的發展中都有很多額外的改進,比如時鐘率具有較穩定的提高,也正是這么多代產品的不斷迭代,才使得現在的DSP48E2 功能更加強大。下圖是論文中作者提到的關于DSP48E2 功能實現的細節。

圖1 DSP48E2 功能細節

同時,在這片IEEE的論文中還討論了如何將此FFT核蝶形轉換到較少的LUT單元中,而如何有效轉換關系到是否可以實現DSP48 preadders的蝶形地址,在實現過程中,通過將有效的數據映射和轉換因子存儲到BRAM 及分布式存儲資源中,有效地完成 radix-2k算法轉換因子的共享,此外采用重新定時和流水的方式來縮短實現時間。

雖然這篇博客展示的任何技術都是來自于論文中,讀者也可以從IEEE論文網站得到,但是還是會給出論文中的一些結論(以便可以提起您去檢索并閱讀全文的興趣):“報告的實現結果表明,相比于之前的有關實現而言,通過利用Virtex-4和Virtex-6內部的DSP48實現一個FFT核,可以使其性能分別提高350%到400%,同時,還可以獲得一個更高的混合時鐘頻率,并且整個實現過程只需要更少的存儲資源。這也正好如以前發表過的最好的報告結果一樣,都是使用完全一樣的架構,使用同Virtex-4完全一樣的算法,也體現出這種轉換的優勢十分明顯,所以,為提高性能,可以嘗試將架構映射到FPGA硬件結構中來實現。

總結:

在目前的市場中,尤其是一些互聯網公司,都開始利用FPGA做硬件加速的實現,不僅是因為FPGA的可用性,更主要的是各大公司都看中了硬件實現軟件算法時對整個算法質量的極大提升,這類市場也恰好是我們Xilinx未來競爭的關鍵點所在。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Xilinx
    +關注

    關注

    71

    文章

    2171

    瀏覽量

    122148
  • FFT
    FFT
    +關注

    關注

    15

    文章

    437

    瀏覽量

    59563

原文標題:性能飛升350%~400%!Xilinx DSP slices 實現 SDF 流水 FFT Core

文章出處:【微信號:xilinx_inc,微信公眾號:賽靈思】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Vivado Xilinx FFT IP核v9.0使用說明

    一 傅里葉變換FFT 想必大家對傅里葉老人家都不陌生了,網上也有這方面的很多資料。通過FFT將時域信號轉換到頻域,從而對一些在時域上難以分析的信號在頻域上進行處理。在這里,我們需要注意采樣頻率
    的頭像 發表于 01-08 11:33 ?435次閱讀
    Vivado <b class='flag-5'>Xilinx</b> <b class='flag-5'>FFT</b> IP核v9.0使用說明

    EE-267:在SISD和SIMD SHARC處理器上實現就地FFT

    電子發燒友網站提供《EE-267:在SISD和SIMD SHARC處理器上實現就地FFT.pdf》資料免費下載
    發表于 01-05 09:54 ?0次下載
    EE-267:在SISD和SIMD SHARC處理器上<b class='flag-5'>實現</b>就地<b class='flag-5'>FFT</b>

    dsp28035中用使用cla來進行fft要怎么配置?

    dsp28035中用使用cla來進行fft,f28035.cmd要怎么配置,假設是adc采樣進來的數據要進行fft,那還需要怎么其他的配置
    發表于 12-12 08:27

    Vivado中FFT IP核的使用教程

    本文介紹了Vidado中FFT IP核的使用,具體內容為:調用IP核>>配置界面介紹>>IP核端口介紹>>MATLAB生成測試數據>>測試verilogHDL>>TestBench仿真>>結果驗證>>FFT運算。
    的頭像 發表于 11-06 09:51 ?1484次閱讀
    Vivado中<b class='flag-5'>FFT</b> IP核的使用教程

    TMS320VC5505、TMS320C5505和TMS320C5515 DSP上的FFT實現

    電子發燒友網站提供《TMS320VC5505、TMS320C5505和TMS320C5515 DSP上的FFT實現.pdf》資料免費下載
    發表于 10-12 09:21 ?0次下載
    TMS320VC5505、TMS320C5505和TMS320C5515 <b class='flag-5'>DSP</b>上的<b class='flag-5'>FFT</b><b class='flag-5'>實現</b>

    使用DSPLIB FFT實現實現實際輸入,無需數據縮放

    電子發燒友網站提供《使用DSPLIB FFT實現實現實際輸入,無需數據縮放.pdf》資料免費下載
    發表于 09-19 11:27 ?0次下載
    使用DSPLIB <b class='flag-5'>FFT</b><b class='flag-5'>實現實現</b>實際輸入,無需數據縮放

    用STM32F4或者STM32L4自帶的DSP庫做FFT運算是不是只能做基2的點數?

    請教,用STM32F4或者STM32L4自帶的DSP庫做FFT運算是不是只能做基2的點數,如果采樣200點,還能用dsp庫來進行FFT嘛,或者自己找個任意點數的
    發表于 05-11 08:32

    STM32的DSP庫函數FFTarm_fft_bin_example里面,為什么.arm_fft_bin_data.c的數據都是隔一個位置補0的?

    STM32的DSP庫函數,FFTarm_fft_bin_example里面,為什么.arm_fft_bin_data.c的數據都是隔一個位置補0的,然后數據有2048個,實際arm_cfft_f32
    發表于 05-08 07:02

    請問DSP LIB中怎么沒有窗函數?

    我發現DSP LIB中沒有窗函數,難道FFT函數內部已做了優化?
    發表于 04-28 06:19

    stm32f1 DSP庫做FFT變換結果不正確是什么原因導致的?

    用stm32f103 的dsp庫做FFT,當頻率為浮點數時結果不正確。 #define NPT(256)//采樣點數 #define PI2(6.28318530717959) #define
    發表于 04-25 08:22

    芯片后仿之SDF 3.0解析(三)

    本文接著解析SDF3.0的Timing Checks Entries、Timing Environment Entries兩個部分。
    的頭像 發表于 04-16 11:08 ?1997次閱讀
    芯片后仿之<b class='flag-5'>SDF</b> 3.0解析(三)

    FPGA實現雙調排序方法詳解

    根據數據流的關系,我們可以采用單路徑延遲反饋(Single-pathDelay Feedback, SDF)運算單元流水結構,SDF單元如下圖所示。
    發表于 03-28 10:45 ?574次閱讀
    FPGA<b class='flag-5'>實現</b>雙調排序方法詳解

    基于NVIDIA Megatron Core的MOE LLM實現和訓練優化

    本文將分享阿里云人工智能平臺 PAI 團隊與 NVIDIA Megatron-Core 團隊在 MoE (Mixture of Experts) 大語言模型(LLM)實現與訓練優化上的創新工作。
    的頭像 發表于 03-22 09:50 ?883次閱讀
    基于NVIDIA Megatron <b class='flag-5'>Core</b>的MOE LLM<b class='flag-5'>實現</b>和訓練優化

    DSP芯片性能參數有哪些重要指標?

    DSP芯片,即數字信號處理芯片,是一種專門用于數字信號處理的集成電路。它采用程序和數據分開的哈佛結構,具有專門的硬件乘法器,廣泛采用流水線操作,提供特殊的DSP指令,可以快速地實現各種
    的頭像 發表于 03-21 10:00 ?2374次閱讀

    示波器的 FFT 功能怎么調?

    示波器fft功能-示波器中的快速傅立葉變換 FFT功能非常有用。是德科技與您分享keysight示波器fft調出來的方法。Keysight示波器FFT調出來的方法
    的頭像 發表于 03-19 18:04 ?3376次閱讀
    示波器的 <b class='flag-5'>FFT</b> 功能怎么調?
    大发888缺少casino| 百家乐官网赢钱面面观| 百家乐官网真人大头贴| 乐众国际娱乐| 格龙24山五行| 百家乐平台| 赌博中百家乐什么意思| 利来游戏| 博彩百家乐网址| 监利县| 网上百家乐真坑人| 澳门百家乐官网单注下限| 百家乐游戏玩法规则| 大发888娱乐场下载专区| 澳门百家乐官网在线| 百家乐投住系统| 百家乐官网佛泰阁| 决胜德州扑克刷金币| 全迅网百家乐官网的玩法技巧和规则 | 大玩家百家乐官网现金网| 澳门百家乐玩大小| 皇冠足球比分| 百家乐最佳投注法下载| 爱赢娱乐| 百家乐大娱乐场开户注册| 百家乐官网胜率被控制| 澳门百家乐怎么看小路| 玩百家乐官网澳门皇宫娱乐城| 博之道百家乐技巧| 百家乐官网看图赢| 大发888刮刮乐下载| 百家乐官网过滤| 百家乐官网代理商博彩e族| 女优百家乐的玩法技巧和规则| 百家乐官网高手长胜攻略| 大发888线上娱乐百家乐| 百家乐有真假宝单吗| 百家乐官网小钱赢钱| 威尼斯人娱乐城首选802com| 筹码百家乐官网的玩法技巧和规则| 大发888舍出同线牌|