異構計算為什么會異軍突起？基于FPGA的異構計算討論

一、異構計算ABC

簡單的介紹幾個概念，同道中人可以忽略這一段。云計算取代傳統IT基礎設施已經基本成為業界共識和不可阻擋的趨勢。云計算離不開數據中心，數據中心離不開服務器，而服務器則離不開CPU。當然，世事無絕對，上述三個“離不開”自然是針對當下以及并不久遠的未來而言。而異構計算的“異構”指的是“不同于”CPU的指令集。

異構計算聽起來是一個高大上兼不明覺厲的概念，實際上，我們大致可以用“加速協處理器”的概念來替代異構計算，這樣理解起來也許就容易多了。云計算在最開始指的就是基于CPU的計算，異構計算異軍突起之后，云計算就分成了基于CPU的通用計算和基于CPU+FPGA、CPU+GPU的異構計算。

可能有的讀者說：CPU+ASIC難道不是異構計算么？當然算，只不過，拋開ASIC的優點（高性能、大批量前提下的低成本）不說，ASIC的高開發成本（進入10nm工藝時代，流一次片可能動輒幾百萬乃至數千萬美元）和長上市時間（從立項到上市最少也要一到兩年的時間）是兩個非常不利的因素。因為目前異構計算所針對的垂直行業都具有快速變化、快速迭代的特點，是ASIC完全沒有辦法滿足的。所以到目前為止，基于ASIC的異構計算占比極少，基本可以忽略不計。

本文聚焦于討論基于FPGA的異構計算，為了行文方便起見，下文中提到異構計算就是指FPGA異構計算。

下面的圖、表對CPU、GPU、FPGA和ASIC各自的優劣勢進行了簡單的比較：

表1：CPU、ASIC、GPU、FPGA特性簡單對比

圖1：CPU、ASIC、GPU、FPGA能效與靈活性對比

圖2：計算密集型任務，CPU、GPU、FPGA、ASIC的數量級比較（16位整數乘法）

二、為什么要異構計算

異構計算為什么會異軍突起？其實假如CPU一直很牛很牛，可以完全滿足客戶對于“計算”的海量需求，那就沒有FPGA什么事兒了。當然了，CPU一直在摩爾定律的驅動下變的越來越牛，可是一來客戶的需求變的比CPU的能力更牛，二來隨著芯片工藝的推進，摩爾定律漸有失效的跡象，CPU越來越需要一位具備“專業”加速能力的伙伴了。

縱觀CPU的演進歷史，我們可以看到為了跟上摩爾定律的步伐，業界可謂是出了渾身解數。第一板斧就是通過不斷的提升工作的主時鐘頻率來提高效率：時鐘頻率越高，意味著單位時間內可以執行的指令越多，從而提升了效率。但是時鐘頻率不可能無限提高，因為CPU本質上也是一種ASIC，也是由一個個的晶體管、一個個的邏輯門組成的，而晶體管、邏輯門都需要特定的充放電時間來完成“0”、“1”狀態的轉換。這個特定的充放電時間就決定了CPU工作時鐘的時鐘周期，也就決定了時鐘頻率。

提升時鐘頻率遇到了天花板，業界又想出了第二板斧：“多任務、多線程”，讓CPU可以“同時”做兩件乃至更多件事情，如同周伯通的“一心二用”，從而可以“左右互搏”，這當然是神話。CPU終究是一個“分時復用”的東東，再牛叉的CPU，同一時刻也只能跑一條指令。多任務多線程的實質不過是充分利用CPU執行某個任務時的“空閑”時間來干點別的活兒，假如某個任務長期100%霸占CPU，那么再多的任務和線程也沒什么用，只能乖乖等著。

緊接著第三板斧又來了：多核。就是在一個package里面封裝多個物理核，理論上多核CPU就相當于之前同等數量的單核CPU。但是這些核之間是需要通信協同的，這就導致了性能的降低，比如一顆雙核CPU的效能大致等同于1.8顆單核CPU。而且由于散熱、封裝等因素的限制，也不可能在一個package里塞下幾百上千個核，盡管Intel已經推出了96核的CPU。多核還面臨DarkSilicon的問題，依靠增加核數來提升CPU性能之路已經走到盡頭。關于什么是DarkSilicon，簡單的說就是由于功耗的限制，多核CPU中可以同時以最高性能工作的核數是非常有限的，其他的核都處于閑置狀態。如果想進一步了解可以參考如下網頁：https://zhuanlan.zhihu.com/p/20833753。

除了上述三板斧，業界暫時沒有再找到可以大幅提升CPU計算力的辦法，而在某些特定領域，對CPU算力的需求簡直是貪得無厭、無窮無盡的，比如深度學習、圖像和視頻轉碼等，這時候FPGA的“空間”計算力就可以大顯身手了。

其實異構計算的興起要感謝AI和GPU。AI離不開各種xNN，也就是神經網絡，CPU算起來真是力不從心，而GPU則似乎天生適合干這個活兒（訓練）。因此，隨著過去兩三年AI的炙手可熱，GPU異構計算也風生水起，nVidia的股價居然在一年時間內暴漲三倍（當然不全是異構計算導致的顯卡需求暴增，還有數字貨幣帶動的挖礦產業）。

所以，歸納起來，異構計算之所以會興起，就是因為在某些特定行業或者特定應用場景，采用CPU作為算力解決方案的性價比是不高的。而根據這些不同的行業或者場景來選用CPU+GPU或者CPU+FPGA做解決方案的性價比則是很高的。CPU、GPU和FPGA各自“天生”的特性決定了它們都有各自最擅長（或者說性價比最高）的應用領域，在這些領域里，CPU+GPU或者CPU+FPGA的組合而不是純CPU組合，是最優的解決方案。從純技術的角度來爭論CPU、GPU和FPGA孰優孰劣不是一件很有意義的事情，一定要從解決方案和商業的角度來做對比才更有說服力。

三、FPGA異構計算的錢景

馬老師說了，每天做著可以改變世界的事情，就會打滿雞血，充滿激情。我斗膽替馬老師接一句：做好了這些改變世界的事情，wholebunchofmoney就是自然而然的結果。我一直的觀點是：技術是為商業服務的，技術只是手段，商業成功才是目的。因此見客戶一定要先談錢：使用阿里云的FPGA加速解決方案，既能幫您掙錢，又能幫您省錢，這樣客戶才會開開心心的掏錢。然后再談情懷，談詩和遠方，光跟客戶談詩和遠方，會被客戶轟出來的。

基于上面的分析，我們來看看FPGA異構計算的錢景如何。先看下圖（預測數據來自前瞻產業研究院）：

圖3：2017-2022年中國數據中心市場規模預測（單位：億元）

可以看到2020年中國數據中心市場規模可達近2500億元人民幣，約400億美元。按照阿里云占據一半市場份額來計算，則為200億美元。根據Intel發布的白皮書預測，到2020年，通用計算市場與異構計算市場會是一個7:3的比例，至于這三成的異構計算市場里面GPU和FPGA的占比如何，要看各自所適合的垂直行業的發展情況。我們姑且認為GPU和FPGA各占15%，那么FPGA異構計算市場規模為30億美元，對比整個阿里云2017年全年營收133億人民幣（預計2020年超800億，屆時異構計算可能占比三成，達到240億人民幣），可見FPGA異構計算的市場錢景是相當可觀的。

我個人堅定的看好FPGA異構計算的未來（學習博士當年堅持搞阿里云的精神和不達目的不罷休的勁頭：nottobelievebecauseIseebuttoseebecauseIbelieve）。隨著云計算逐步變成和水電煤氣一樣的基礎設施，整個市場容量要以萬億乃至數十萬億美元來計算。FPGA異構計算即使只占10%，那也是千億美元的大市場。

在未來的云計算、數據中心市場，純CPU、CPU+GPU和CPU+FPGA的解決方案將長期并存下去，中、短期看，是一個CPU+GPU/CPU+FPGA方案不斷蠶食純CPU方案的過程。在這個過程中，CPU廠商、FPGA廠商也會為了鞏固自己的地盤兼搶奪別人的地盤，基于各自的優勢，選擇提供一攬子芯片解決方案。比如CPU廠商會推出內嵌FPGA/GPU的超級CPU；而可編程邏輯器件廠商則會在FPGA器件中嵌入CPU和GPU硬核。

對于提供FPGAasaService（FaaS）的云服務提供商來說，FPGA異構計算能否成功的關鍵則在于IP生態的建設。IP解決方案齊全的云服務提供商，未來可以像搭樂高積木一樣，迅速的為客戶“量身定做”出性價比最高的解決方案，并通過自己的FaaS平臺向客戶輸出，而缺乏IP生態的廠商則很難得到客戶的青睞。

四、HLS與RTL—從菜刀到小李飛刀

在FPGA設計領域，HLS是HighLevelSynthesis（高層次綜合）的縮寫，RTL是RegisterTransferLevel（寄存器傳輸級）的縮寫。順便吐槽一下，從事ICT行業，就要不斷的面對各種各樣的縮寫，很煩人，但是呢，表達效率確實很高。漢語也有類似縮寫：比如喜大普奔、不明覺厲、男默女淚、火鉗劉明，等等，等等。

1998年，作為新鮮出爐的大菜鳥一只，我加入了一家通信公司，職責是開發一塊單板。就是畫PCB、寫單板軟件、設計FPGA乃至到最后的焊板子等等全部自己搞定。那時候根本不知道硬件描述語言為何物，只能向當時的老鳥學習使用74系列集成電路來做FPGA設計。雖說不是一個邏輯門一個邏輯門的來搭電路，其實也差不多了。可想而知，這樣做的效率能高到哪里去。但是這樣做也有好處：你對整個電路了然于胸，可以清楚的知道到哪個時鐘節拍哪個門該反轉、哪個三八譯碼器該輸出什么碼、哪個移位寄存器的輸出應該是什么。況且，那時候的FPGA和CPLD的容量都小，所以這么做效率上也沒啥違和感。

等到了1999、2000年左右，XILINX開始推出Virtex系列時，這個辦法就不太靈了：FPGA的電路規模已經太大，再畫圖設計的話，周期可能要兩年乃至三年，完全抹殺了FPGA靈活可編程、上市時間短的優勢。被逼無奈之下，自己開始學習VerilogHDL，摸索如何使用第三方綜合工具來綜合（那時候XILINX的ISE和Altera的Quartus綜合和仿真功能都很弱）、使用第三方工具來做仿真。也要感謝當時同一個小團隊的另一只老鳥（老鳥姓魯，對我真是傾囊相授），給了我很多指點，非常無私的那種。我樸素的認為一花獨放不是春、大家好才是真的好，于是就開始寫各種教程、制定大規模FPGA的整套開發流程、寫課件給同事講課。事情越鬧騰越大，引起了上層的注意，就把我跟另一個部門做FPGA的幾個老鳥給抓到了一起，封閉了半年之久，整天啃各種各樣的“工程類”的書籍。最終我們輸出了“XX公司邏輯設計LCMM流程1.0”。LCMM就是LogicCMM，因為當時CMM很流行，各家軟件公司都標榜自己是CMM3/4/5，我們就無恥的蹭了一下CMM的流量。

Verilog和VDHL都是基于RTL層級的硬件描述語言（HDL）。相對而言，Verilog靈活性高一些，而VHDL語法更嚴謹一些。綜合工具很容易把HDL的描述映射成相應的硬件電路，所以綜合工具把精力放在如何更高效上：比如綜合時間盡可能短、綜合效率盡量高（占用面積低、時鐘運行頻率高）。HDL相比畫電路圖，在“電路”效率上可能要低一些，因為畢竟多了一層抽象；但是在開發效率上，那可是高了不止一個數量級。而且隨著綜合工具的進步，“電路效率”的差異逐漸被抹平了。

HDL已經如此之“完美”，為什么又會冒出HLS呢？一方面，人類追求真善美是無止境的（這是一句雞湯，不喜歡的就不用看了），真正重要的是：隨著FPGA規模的增大，驗證FPGA的功能仿真階段在整個開發過程中的占比越來越高。2000年之前，可能設計電路和驗證功能（功能仿真）時間占比可能是8比2，到后來逐漸的7比3，再到現在差不多4比6了。也就是說，超過一多半的時間花在了功能驗證上了。這一多半時間中的一半又花在哪里了呢？設計和編寫testbench了。testbench是個神馬東東呢？講白了就是一個數據發生器兼接收器兼鑒別器：把數據（不管是否合法）灌進FPGA、從FPGA接收反饋、然后根據預設的需求規格來判定FPGA反饋的對還是不對。

用HDL做設計，必須要考慮功能、可綜合、效率、時鐘樹、功耗、IO、布局布線等等N多因素。可是用HDL寫testbench完全沒必要考慮那么多。一個顯而易見的推論就是：使用更高層次的抽象語言顯然可以大幅度提高testbench的建模和設計效率，從而就從整體上大幅縮短了FPGA的開發周期。在經歷了SystemVerilog、SystemC、C、C++、OpenCL等諸多嘗試之后，使用更高抽象層次的設計語言來設計FPGA就變成了眾望所歸（用中文來說就是變成了剛需），就有了今天的HLS。

那么問題來了：HDL和HLS相比，到底哪個更好？Well，回答這個問題還是需要一定的水平的，不然結局要么友誼的小船說翻就翻，要么就跳進人家給你挖的坑里了。如同前面介紹通用計算和異構計算時比較CPU、GPU和FPGA，要看面對的具體應用場景。回答這個問題也要看針對FPGA設計的哪個方面說。從電路效率角度，HDL肯定秒殺HLS；而從仿真建模效率角度，HLS肯定秒殺HDL。HLS當下最大的短板就是“電路效率”太低。簡單說：同樣一個功能，用HLS不但會占用面積大，而且能跑的時鐘頻率低。這個短板完全是HLS的高度抽象所帶來的，也就是說，高度抽象既是HLS仿真建模的最大優勢，又是設計綜合的最大劣勢。舉個簡單的例子（例子不一定實際可以驗證，只是為了更簡潔的說明問題）：用HLS寫了一段代碼（不管是C/C++還是OpenCL），你期望綜合出的電路就是一塊可以做異步FIFO的RAM。但是由于HLS的高度抽象，對于（智商令人捉急的）綜合工具來說，可以綜合成RAM，也可以綜合成組合邏輯，或許還有第三、第四種解讀…也就是說，綜合工具暫時沒能力綜合一個最高效的電路出來。

簡而言之，在當下以及不那么久遠的將來，使用HDL進行設計而使用HLS進行建模和驗證，將是最佳的設計模式：取得了電路效率和驗證效率的最佳平衡。隨著EDA工具的不斷進步（智商余額不斷提高），將來我們可以期待HLS既可以設計代碼，也可以建模驗證。菜刀也就終于進化成了無堅不摧的小李飛刀。

圖4：同樣的功能，使用HLS和使用RTL分別來描述的對比

審核編輯：劉清

閱讀全文

FPGA(591969) FPGA(591969)
asic(119147) asic(119147)
晶體管(134510) 晶體管(134510)
cpu芯片(13451) cpu芯片(13451)
異構計算(16151) 異構計算(16151)

Tensilica加入HSA基金會，助力嵌入式異構計算標準建立

Tensilica今日宣布加入HSA基金會（異構系統架構），以下簡稱HSA，HSA是一家非盈利組織，致力于開發架構規范，將現代設備中并行計算引擎的性能和能耗效率充分發揮出來。Tensilica將憑借

2013-04-19 11:40:02

1029

中國首個異構計算處理器IP核實現可用于機器學習

日前，中國華夏芯公司宣布，其異構計算處理器IP核已經在硅片上成功實現，并已通過HSA（異構系統架構）一致性測試。公司還宣布了新的機器學習和深層神經網絡的開源項目，旨在進一步推動HSA異構計算的發展。

2016-09-01 11:42:16

1130

深度解析FPGA異構計算芯片的技術特性

來源：內容來自騰訊架構師，作者austingao。? 1. 異構計算：WHY明明CPU用的好好的，為什么

2017-10-24 13:49:42

5772

詳解FPGA異構計算芯片

半導體行業觀察：隨著互聯網用戶的快速增長，數據體量的急劇膨脹，數據中心對計算的需求也在迅猛上漲。各類應用對計算的需求已遠遠超出了傳統CPU處理器的能力所及。關鍵詞：FPGA，CPU

2017-10-25 05:06:00

6129

加速云發布新品，異構計算加速平臺有效滿足AI及高性能計算業務需求

致力于提供異構計算加速整體解決方案、業界領先的異構加速和業務卸載方案廠商——杭州加速云信息技術有限公司（簡稱：加速云）正式啟動跨越北京、上海、成都、西安四大城市的 “加速新科技，驅動智未來

2018-04-17 16:52:06

6429

基于Xilinx 16nm Virtex UltraScale+器件VU9P的異構計算實例

基于Xilinx 16nm Virtex UltraScale+ 器件VU9P的異構計算實例F3在阿里云上線了！我們借此機會，對阿里云FPGA計算服務本身，以及這次發布的F3實例的底層硬件架構和平臺架構做一個技術解讀....

2018-06-28 09:57:56

27698

采用CXL計劃應對異構計算中的內存解決方案

在計算世界中，不可思議的事情之一是在數據中心中迅速采用人工智能（AI）和云計算。這些和其他因素正在推動異構計算-使用CPU，GPU，FPGA，ASIC加速器，網絡接口控制器（NIC）和其他處理元件

2021-03-19 11:41:14

10288

AMD大中華區總裁潘曉明：異構計算是關鍵的未來趨勢 ADM在三大領域聚焦高性能計算

在南京半導體大會高峰論壇上，AMD大中華區總裁潘曉明表示今天和未來的工作負載需要強大的計算能力，異構計算是關鍵的未來趨勢。AMD未來在計算、圖形和解決方案的三個方面聚焦高性能計算，在持續發展的行業中保持高性能計算領導力。

2021-06-14 10:15:37

11215

異構時代：CPU與GPU的發展演變

異構計算是指在一個系統中使用不同類型的處理器來執行不同的計算任務，以提高性能，效率和可靠性。隨著摩爾定律的放緩，單一類型的處理器已經難以滿足日益增長的運算需求。與此同時，不同類型的處理器具有各自

2023-10-24 10:17:00

484

異構計算的前世今生

異構計算已經成了半導體業界不得不思考的一個話題，傳統通用計算的性能捉襟見肘，過去承諾的每隔一段時間芯片性能翻倍的豪言壯語已經沒有人再提了。如今我們用到的手機中，各種除CPU以外的計算單元層出不窮

2021-12-17 09:35:17

3868

FPGA異構計算在圖片處理上的應用以及HEVC算法原理介紹

《基于異構計算平臺的算法性能優化方法分享》一文。四HEVC圖像壓縮算法之FPGA和CPU實現差異理論上說，如果不考慮FPGA資源、硬件實現架構和處理性能，CPU圖像壓縮算法可以完全在FPGA進行“復制

2018-08-01 09:55:53

FPGA具有的優勢包括哪些

處理器芯片的概念以及發展歷程處理器的分類異構計算的分類和特征能夠對智能計算的基礎組件芯片有一個比較全面的認知1.相比其他的處理器，FPGA具有的優勢包括（）。A.并行能...

2021-07-29 09:28:00

異構計算助力客戶春節webp圖片編碼

；Google+ 移動應用采用 WebP 圖片格式后，每天節省了 50TB 數據存儲空間。但Webp最大的缺點在于壓縮算法計算復雜度是JPEG的10倍以上，我們迫切需要一套高性能加速方案來降低業務成本。項目

2018-03-29 11:47:48

異構計算在人工智能什么作用？

能力的需求。因此，具有GPU、ASIC、 FPGA 或其它加速器（Accelerator）等高并行、高密集的計算能力的異構計算持續火熱，而異構計算也將成為支撐先進和以后更復雜AI 應用的必然的選擇

2019-08-07 08:39:19

異構計算場景下構建可信執行環境

)的杰出講師。文章內容來源第一屆開放原子開源基金會OpenHarmony技術峰會——安全及機密計算分論壇正文內容異構，即將CPU、DSP、GPU、ASIC、FPGA等不同制程架構、不同指

2023-08-15 17:35:09

異構計算的前世今生

2021-12-26 08:00:00

CPU+FPGA，機器人最強大腦即將問世

、多樣化的數據處理需求。借助由GPU、FPGA和其他智能引擎等協處理器與CPU一起組成的異構計算平臺來提升計算性能，已成為當下學術界和工業界的研究熱點。異構計算作為一種特殊的并行計算方式，能夠根據每個

2017-03-20 17:54:31

TSC峰會回顧04 | 異構計算場景下構建可信執行環境

設計自動化委員會(CEDA)的杰出講師。文章內容來源第一屆開放原子開源基金會OpenHarmony技術峰會——安全及機密計算分論壇正文內容異構，即將CPU、DSP、GPU、ASIC、FPGA等

2023-04-19 15:20:32

「深圳云棲大會」大數據時代以及人工智能推動下的阿里云異構計算

Caffe,、Caffe2、CNTK、MXNet、TensorFlow、Theano、Torch等框架。而在異構計算領域，FPGA從專用計算領域，走入大眾的視野，在通用計算行業嶄露頭角，也就是近期的事情

2018-04-04 13:44:35

【產品活動】阿里云GPU云服務器年付5折！阿里云異構計算助推行業發展！

摘要：阿里云GPU云服務器全力支持AI生態發展，進一步普惠開發者紅利，本周將會推出針對異構計算GPU實例GN5年付5折的優惠活動，希望能夠打造良好的AI生態環境，幫助更多的人工智能企業以及項目順利

2017-12-26 11:22:09

什么是異構多處理呢？

什么是異構多處理呢？為什么需要異構多處理系統

2021-02-26 06:59:37

什么是異構并行計算

、GPU、DSP、ASIC、FPGA等。異構計算用簡單的公式可以表示為“CPU+XXX”。舉例來說，AMD著力發展的APU就屬于異構計算，用公式表示就是CPU+GPU。由于術業有專攻，CPU、GPU、DS...

2021-07-19 08:27:56

掃盲人工智能的計算力基石--異構計算

摘要：本文將帶領入門讀者了解CPU，GPU，FPGA，ASIC和異構計算的一些基本概念和優缺點，希望幫助入門者和愛好者建立基本的芯片概念人工智能有三要素：算法，計算力，數據。我們今天

2018-06-28 15:55:53

新冒出來的Efinix會革掉FPGA的命么？

，使用CPU消耗的功耗太大，因此大家覺得還是得為了應用開發專用的芯片，用高度優化的架構來實現高性能?！　?b class="flag-6" style="color: red">FPGA成為市場的寵兒　　在異構計算中，FPGA是重要的設計實現方法。FPGA是一種特殊的芯片，它通過

2018-11-01 20:08:07

請問模型推理只用到了kpu嗎？可以cpu，kpu，fft異構計算嗎？

2023-09-14 08:13:24

邊緣計算指的是什么

的術語包括：分布式計算、混合邊緣計算、異構計算、矩陣計算、盒中數據中心、本地云、網絡邊緣、霧計算等。根據行業的不同，每個術語都有其獨特的含義。在概念層面上，邊緣計算指的是使計算更接近使用它的地方或更接近數據源。這個概念不僅限于計算服務，還可以包括網絡或存儲服務。在物理空間的層面上，邊緣計算分為：Netw

2021-09-15 07:44:16

采用高級語言開發FPGA的探索

轉帖：采用高級語言開發FPGA的探索近年來，由于人工智能和金融數據分析等計算密集型領域的日益興起，異構計算越來越受到大家的重視。異構計算是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式

2017-09-25 10:06:29

異構計算機

fpga云計算cpu/soc

硬十磚家發布于 2021-10-30 14:32:13

超重量級成員高通加盟AMD異構計算組織

六月中旬，AMD聯合ARM、Imagination、聯發科、德州儀器等行業巨頭成立了異構系統架構基金會(HSA Foundation)，推動異構計算的發展，并陸續吸引了多家新廠商的加入，成員數量翻了一番還多

2012-10-05 22:55:47

826

Qualcomm致勝移動行業的戰略支柱：異構計算

Murthy Renduchintala發表的大會開幕主題演講?，F在顯而易見的是，在用于移動終端的專用計算（或稱異構計算）方面樹立領先地位，將幫助Qualcomm在移動時代大獲全勝。

2013-09-12 10:24:28

634

靈活控制CPU協同工作，詳解聯發科CorePilot異構計算技術

在2013年，聯發科全球首創CorePilot異構計算技術，CorePilot是聯發科為旗下多核心產品量身定制的一項新技術，CorePilot異構計算技術可以簡單的看做ARM Big.LITTLE

2016-11-04 18:41:19

468

面向未來智能紀元_共建共享異構計算

5月25日，2017異構計算標準暨國際人工智能大會在廈門隆重開幕。本次大會以“面向未來智能紀元，共建共享異構計算”為主題，是我國首次召開促進人工智能算法及應用與國際主流芯片平臺標準融合發展的大會

2018-04-27 18:07:00

911

異構計算芯片的機遇與挑戰

異構計算的機遇與挑戰 異構計算是指不同類型的指令集和體系架構的計算單元組成的系統的計算方式，目前 CPU+GPU以及CPU+FPGA 都是最受業界關注的異構計算平臺。它最大的優點是具有比傳統CPU

2017-09-27 10:22:47

FPGA異構計算現狀及優化

。 WHEN？深度學習異構計算現狀隨著互聯網用戶的快速增長，數據體量的急劇膨脹，數據中心對計算的需求也在迅猛上漲。同時，人工智能、高性能數據分析和金融分析等計算密集型領域的興起，對計算能力的需求已遠遠超出了傳統CPU處理器的能力所及。

2017-11-15 11:44:52

8213

給CPU直接開掛！從OpenPOWER的CAPI+FPGA看第二代異構計算

什么是異構計算？可能在很多人看來感覺高深莫測，我們可以先用一個比喻來簡單的解釋一下。比如在做簡單的整數算數時，知道算法口訣的人，心算即可，但遇到比較復雜的算數問題時，就得需要一個計算器了，但在

2017-11-17 11:49:46

4626

基于直接后繼節點完成時間的異構調度算法

分布式環境下的異構計算系統（HCS）是大數據時代進行數據密集型計算不可或缺的，一個有效的任務調度算法可以提高整個異構計算系統的效率。在對異構環境下的任務調度進行有向無環圖（ DAG）建模的基礎上

2017-12-07 15:08:27

基于車聯網的QoS改進異構計算最早完成時間調度算法

針對車聯網中數據流分布式處理的調度問題，提出了多維服務質量（ QoS）改進異構計算最早完成時間（ HEFT）調度算法。首先，分別建立了車聯網中數據流的分布式處理任務的帶權有向無環圖模型和車聯網分布式

2017-12-29 16:10:55

異構計算的能效感知調度模型

的精細表述及有效量化，建立面向協同異構計算且易于復用的能效感知云調度模型；另一方面，提出并實現適于超計算機混合體系的多學科背景的元啟發式多目標全局優化算法．從技術上解決了面向不同環境目標的云調度實施條件界定及

2018-01-10 15:38:35

異構計算的多目標測試用例優先排序

，多目標測試用例優化排序是尋找同時覆蓋多個測試準則的用例執行序列，通常采用演化算法優化求解，但執行時間較長，嚴重影響了在實際軟件測試中的應用．采用先進的GPU圖形卡通用并行計算技術，提出了面向CPU+GPU異構計算下的多目

2018-01-15 15:20:53

基于異構并行計算的兩個子概念異構和并行的簡單分析

異構并行計算包含兩個子概念：異構和并行。 1異構是指異構并行計算需要同時處理多個不同架構的計算平臺的問題。 2并行是指異構并行計算主要采用并行的編程方式，所有的處理器都是多核向量處理器，要發揮多種處理器混合平臺的性能必須要采用并行的編程方式。

2018-01-25 16:37:58

6230

當CPU碰上FPGA 異構計算又會發生什么樣的變化

傳統異構方案中，CPU將數據一次性發送給FPGA，處理完成后再交給CPU，加速設備與主機并不同時參與計算。與傳統方案不同，本設計采用了設備間流水處理的加速方案，即：將數據集進行了分組，各組數據在被

2018-07-06 09:06:00

2943

一文了解華為云FPGA異構計算技術火爆的原因

2017年12月23日，星期六，華為云FPGA 異構計算技術私享會在上海3W咖啡成功舉辦。原定150人的活動一經發布，近600人報名參加，雖經多方篩選，會場依然一下子迎來了230多名參會者

2018-06-28 07:49:00

4417

異構計算是未來趨勢，看加速云玩轉FPGA

在人工智能時代，深度學習和機器學習成為企業進行業務創新的重要基礎。而這些有賴于計算力、算法的支撐，于是我們看到異構計算風起云涌。作為專注于異構計算加速平臺解決方案的提供商，近日，加速云在“加速新科技

2018-06-08 13:46:00

1336

NVIDIA Tegra K1異構計算平臺訪存優化研究

在異構計算平臺的移植和優化過程中，數字圖像處理算法的訪存性能已成為制約系統性能的主要因素。為此，結合NVIDIA Tegra K1硬件架構特征和具體算法特性，從合并與向量化訪存優化、全局訪存bank

2018-03-12 11:11:38

基于FPGA的異構計算是趨勢

目前處于AI大爆發時期，異構計算的選擇主要在FPGA和GPU之間。盡管目前異構計算使用最多的是利用GPU來加速，FPGA作為一種高性能、低功耗的可編程芯片，在處理海量數據時，FPGA計算效率更高，優勢更為突出，尤其在大量服務器部署時，隱形的運營成本會得到顯著降低。

2018-04-25 09:17:27

10593

異構計算的兩大派別為什么需要異構計算？

20世紀80年代，異構計算技術就已經誕生了。所謂的異構，就是CPU、DSP、GPU、ASIC、協處理器、FPGA等各種計算單元、使用不同的類型指令集、不同的體系架構的計算單元，組成一個混合的系統，執行計算的特殊方式，就叫做“異構計算”。

2018-04-28 11:41:00

22671

異構計算的軟硬件分割沒有最好，只有更好的詳細資料概述

可以看出，一次旅行，其實結合了各種交通工具的優點。隨著摩爾定律的失效和CPU在AI等并行計算方面的缺陷，目前數據中心的計算機，已經不僅僅是CPU一種計算芯片，還要結合GPU和FPGA做異構計算體系。

2018-07-06 11:00:48

6059

高通AI芯片異構計算滿足AI手機各類不同需求

，能夠利用芯片的異構計算能力來加強機器學習。第三代AI芯片驍龍845集成高通最新推出的人工智能引擎AI Engine，能夠實現最頂尖的終端AI處理。

2018-07-27 14:28:02

912

異構計算：架構與技術

如果您希望創建優秀的移動體驗，那么，優化就不是可有可無的事情，而是關鍵之舉。它可以幫助您將好的想法實現得更加出彩。在上一篇“使用QDN異構計算工具開發項目”文章中，我們討論了異構計算的概念

2018-09-18 19:18:20

715

Qualcomm：使用QDN異構計算工具開發項目

如何提高應用性能？如何充分利用硬件？如果有限的處理能力、能量管理和發熱量問題對于您的產品性能來說十分重要，那么異構計算可能是您解決問題的答案。當我們在談論異構計算時，我們在談論如何利用

2018-09-18 19:18:39

265

異構計算，你準備好了么？

摩爾定律失靈了，已是不爭的事實。單純的提升一種芯片性能變的代價越來越高，與此同時，異構計算成為提高計算力的主流方向。什么是異構計算？ 異構計算的前景怎么樣？ OpenPOWER系統上FPGA

2018-09-25 17:27:02

349

阿里云異構計算產品是如何保障雙11業務的

保駕護航。作為IT基礎設施的基石，阿里云ECS為阿里集團雙十一業務提供了強有力的計算保障。阿里云異構計算產品——GPU云服務器和FPGA云服務器，作為ECS產品家族中的一員，今年支撐了集團超過10個BU

2018-11-28 16:45:08

210

阿里云異構計算團隊亮相英偉達2018 GTC大會

，支撐快速部署和彈性伸縮，可能會改變軟件行業開發、測試、部署和應用的模式。2、阿里云異構計算團隊亮相英偉達2018 GTC大會英偉達2018 GTC大會于11月20日-22日在蘇州召開，大會吸引

2018-12-04 16:19:53

182

英特爾超異構計算愿景，實現新“超越”

，從32位到64位，從單核到多核，從同構到異構，每一次架構革命都讓芯片產生質的飛躍。而在智能互聯的AIoT時代，異構計算芯片成為當仁不讓的主角。畢竟，在經歷了數字化、互聯網化、移動互聯網化的洗禮之后，人工智能化時代的海量計算需求、算法迭代讓傳

2019-04-16 16:39:28

341

新AI時代的“利器”,異構計算將重塑產業格局

異構計算的顯著優勢在于實現了性能、成本和功耗均衡的技術，同時也是讓最適合的專用硬件去做最適合的事如密集計算或外設管理等，從而達到性能和成本的最優化。這

2019-04-28 17:38:03

3101

加速第二代分布式計算 IBM 和賽靈思啟動首屆異構計算大賽

隨著新業務的快速增加和海量數據，業界對于服務器的性能及功耗要求越來越高?；赬ilinx全可編程FPGA，POWER處理器和CAPI異構計算技術的第二代分布式計算是支持行業發展的重要技術，可以為數據中心應用帶來數十倍甚至上百倍的性能功耗比提高，同時支持軟件定義數據中心發展。

2019-07-30 16:47:26

1743

賽靈思解讀異構計算

IBM中國研究院的高級研究員陳飛表示，IBM提出的第二代分布式計算有四個重要的特征，第一個特征：加速器的軟硬件接口有統一的接口規范，以便于更好的協同管理與普適（第一代分布式計算的接口標準較為統一，畢竟只有CPU本身，相對更標準化），這方面CAPI就是一個標準化接口的嘗試。

2019-07-30 18:03:23

3435

英特爾發布oneAPI, 引領軟件變革，致力未來異構計算

行業計劃，為跨多種包括CPU、GPU、FPGA和其他加速器在內的異構計算，提供了一個統一和簡化的應用程序開發編程模型。oneAPI的發布源自英特爾數百萬小時軟件工程開發的努力,并且標志著一個行業內的變革，從今天受限、封閉的編程方法演變到一個開放的、基于標準的模式，

2019-11-18 23:15:34

285

4家OS廠商基于openEuler發布商業發行版，加速多核異構計算產業發展

麒麟軟件、普華基礎軟件、統信軟件、中科院軟件所4家領先的OS廠家，發布基于openEuler的商業發行版，標志openEuler操作系統已具備規模商用能力，加速多核異構計算產業發展。 openEuler

2020-03-31 09:55:36

2328

CPU與GPU的區別

CPU、GPU等協處理器、DSP、ASIC、FPGA等。一個異構計算平臺往往包含使用不同指令集架構(ISA)的處理器。

2020-09-04 15:03:09

6202

異構計算成為“戰場”？

異構計算加速的大背景下，巨頭吞并成為了今年的代名詞。 10月9日，華爾街日報消息稱，美國處理器AMD（超威半導體）公司正在就收購競爭對手芯片制造商Xilinx（賽靈思半導體）進行深入談判，交易

2020-10-14 15:21:28

1581

異構計算或引發芯片巨頭割據戰

達對ARM的收購，以及AMD對賽靈思的收購，也昭示著芯片巨頭們與英特爾的“不謀而合”，它們紛紛將未來的布局瞄準了同一個方向：異構計算。

2020-12-24 09:12:18

1694

國內首款基于FPGA異構計算的SaaS動圖轉碼產品正式上線

近日，國內首款基于FPGA異構計算的SaaS動圖轉碼產品，正式上線阿里云市場。該產品由北京深維科技研發，已經上線為南瓜電影的影片動態海報功能提供服務。除視頻點播外，未來還有望在UGC視頻、電子商務

2021-01-27 13:47:12

1505

龍芯平臺異構計算技術交流會成功舉辦

2021年4月14日，由江蘇航天龍夢信息技術有限公司和南京航空航天大學聯合主辦的“龍芯平臺異構計算技術交流會”在航天龍夢南京公司成功舉辦。來自中科院計算所、南航、南郵、山東大學等科研院校學者，和龍

2021-04-22 10:32:12

1764

異構混合并行編程模型及其研究綜述

隨著人工智能和大數據等計算機應用對算力需求的迅猛增長以及應用場景的多樣化，異構混合并行計算成為了研究的重點。文中介紹了當前主要的異構計算機體系結構，包括CPU/協處理器、CPU/眾核處理器、CPU

2021-05-13 10:30:35

阿里云震旦異構計算加速平臺基于NVIDIA Tensor Core GPU

阿里云震旦異構計算加速平臺基于NVIDIA Tensor Core GPU，通過機器學習模型的自動優化技術，大幅提升了算子的執行效率，刷新了NVIDIA A100、A10、T4的GPU單卡性能

2021-08-13 10:17:29

3119

異構計算發展趨勢的助力

。2020年NVIDIA公司發布的DPU產品戰略中將其定位為數據中心繼CPU和GPU之后的“第三顆主力芯片”，掀起了一波行業熱潮。DPU的出現是異構計算的一個階段性標志。與GPU的發展類似，DPU是應用驅動的體系結構設計的又一典型案例；但與GPU不同的是，DPU面向的應用更加底層。DPU要解決的核心

2021-10-27 09:16:32

2190

2021 OPPO開發者大會：游戲中的異構計算

2021 OPPO開發者大會：游戲中的異構計算 2021 OPPO開發者大會上介紹了游戲中的異構計算。責任編輯：haq

2021-10-27 11:08:31

1232

2021 OPPO開發者大會：異構計算開發者價值

2021 OPPO開發者大會：異構計算開發者價值 2021 OPPO開發者大會上介紹了異構計算開發者價值。責任編輯：haq

2021-10-27 11:10:30

1551

2021 OPPO開發者大會：異構計算系統級性能功耗優化方案

專場、個性化裝扮專場、商業專場、智能服務專場、車機互融專場和安全與隱私專場，還將在現場設立互動體驗區，供到場嘉賓和參會人員近距離感受OPPO及行業前沿的技術與應用。 異構計算系統級性能功耗優化方案 ? ? 編輯：ymf

2021-10-27 11:44:46

1458

OPPO開發者大會2021 關于異構計算

關于異構計算系統級性能功耗優化方案的異構部署、異構內核、易購底座等相關內容。

2021-10-27 17:56:20

2969

OPPO開發者大會2021 游戲中的異構計算

異構計算在游戲中的使用，會有什么樣的優勢？

2021-10-28 15:21:58

2842

華為借助異構計算架構CANN推動技術行業落地

會上，華為昇騰CANN生態高級總監王海彬發表了《昇騰CANN釋放硬件澎湃算力》的主題演講，分享在當前波濤洶涌的AI浪潮中，華為如何借助異構計算架構CANN（Compute Architecture for Neural Networks）進行技術創新和生態開展，持續使能科研和產業關鍵突破，推動技術行業落地。

2021-12-16 17:29:39

2601

異構計算真就完美無缺嗎

2021-12-21 09:25:50

1630

為什么說“眾核異構計算”是必然趨勢？

經常有朋友問，“為什么認為眾核異構計算是必然趨勢呢？”。實際上這個問題在業內已經是共識了，所以本文希望從更淺顯的角度來解釋這個問題。首先，需要解釋“為什么當下正處于算力大爆炸時代” ? 越強大的人

2022-04-01 18:29:57

13567

異構計算中的挑戰與解決方案

　　異構系統是各種技術顛覆的核心。平板電腦、智能手機和科學計算機都是作為專門系統創建的。展望未來，異構架構在創建下一代顛覆性設備方面發揮著至關重要的作用。

2022-06-08 16:43:55

1451

GPU計算對嵌入式應用產生影響

　　具體來說，教程是異構系統架構——下一代異構計算的基礎，以及醫療和打印成像中的 GPU 計算，而小組的主題是異構系統架構：未來的功率、性能和編程。

2022-06-13 10:12:30

1089

SoC和異構計算的挑戰

用于 SoC 的軟件通常會抽象功能，以便輕松地對其進行編程和連接。SoC 的優勢在于它更便宜、更小且更節能。缺點是，與全尺寸計算機不同，它們被鎖定在其配置中。

2022-07-28 15:26:58

1149

將OpenCL編譯到FPGA

OpenCL 框架解決異構計算的挑戰

2022-08-29 08:07:36

1835

“加速全真互聯”NVIDIA+騰訊云異構計算分享會

“異構計算”平臺提供云端磅礴算力和彈性擴縮容能力，也需要基礎設施提供強大且穩固的基礎算力，其背后支撐的核心就是?NVIDIA GPU。 9 月 2 日下午 230?騰訊云邀請了 NVIDIA 專家以及其他相關的合作伙伴，在深圳將舉辦一場以“加速全真互聯”為

2022-08-30 10:42:37

430

RISC-V如何做好異構計算

未來幾年，按照預測RISC-V將會以更加恐怖的速度增長，除了在原有這些領域發揮重要價值，RISC-V肯定還需要拓展更多新的領域，其中異構計算領域對于RISC-V而言至關重要，能夠發揮RISC-V指令集的全方位優勢，并有望催生全新的計算芯片體系。

2022-09-02 09:52:26

906

小眼探索首次推出基于靈汐科技類腦芯片KA200的邊緣異構計算平臺

小眼探索首次推出了基于靈汐科技類腦芯片KA200的邊緣異構計算平臺Tiny-Brain Y300及面向行業級無人機光電吊艙的感知和控制解決方案。該方案采用1顆高清攝像頭和一顆紅外熱成像相機，集成

2022-09-06 11:36:09

3562

“加速全真互聯”NVIDIA 邀您參與 11 月 25 日騰訊云異構計算分享會

隨著 VR 等新技術、新硬件和軟件在各種不同場景的應用，移動互聯網將迎來又一次升級。騰訊由此提出了 “全真互聯網” 的概念。全真互聯網包含芯片、計算、傳輸、虛擬集成世界等多個維度，既需要“異構計算

2022-11-24 19:45:02

403

什么是超異構計算？如何駕馭超異構計算？

為什么現在才提超異構這個概念。這里面其實有很多原因，我們總結了大概4個部分，第一個首先是業務需求驅動，現在軟件新應用層出不窮，兩年一個新熱點；并且，已有的熱點技術仍在快速演進。

2022-12-20 12:34:06

1329

從CPU到ASIC，架構越來越碎片化

是超異構計算架構。CPU+GPU+FPGA+DSA等多種架構處理引擎組成的超異構計算；實現既要又要：接近CPU的靈活性，接近ASIC的性能效率，以及多個數量級提升的性能。

2023-01-05 11:31:58

1532

異構計算：邁向智能計算世界

操作系統作為計算產業中最基礎的軟件，承擔著抽象底層硬件，向上層應用提供統一接口的核心功能，是計算產業的關鍵環節。面向多樣性計算和海量應用場景，操作系統應支持多樣算力和多種應用的協同

2023-02-03 16:20:53

874

FPGA之異構計算

對于一個開發人員，可能聽說過FPGA，甚至在大學課程設計中，可能拿FPGA做過計算機體系架構相關的驗證，但是對于它的第一印象可能覺得這是硬件工程師干的事兒。目前，隨著人工智能的興起，GPU 借助

2023-02-03 20:40:03

500

RISC-V給異構計算帶來新活力

來源: EEWORLD ChatGPT的火熱，持續催生著包括人工智能、大數據等應用的火熱。在不斷興起的新應用的背后，需要更復雜的計算方式，而異構計算概念也因此誕生。將不同的計算任務進行分解，利用包括

2023-03-11 00:45:14

409

構建面向異構算力的邊緣計算云平臺

數據又消費數據，再慢慢到設備與設備之間的信息互聯，萬物互聯的時代已然到來。在萬物互聯時代，需要計算的數據越來越多，需求在不斷的變化，異構計算能夠充分發揮 CPU/GPU 在通用計算上的靈活性，及時響應數據處理需求，搭配上 FPGA

2023-05-18 17:15:21

PrimeSimSPICE：異構計算模型實現數量級性能突破

隨著對更高計算性能的需求不斷增加，HPC 行業正朝著異構計算模型發展，其中 GPU 和 CPU 協同工作以執行通用計算任務。在這種異構計算模型中，GPU 充當 CPU 的加速器，以減輕 CPU

2023-05-24 16:53:00

554

異構計算的初步創新

更高，x16帶寬（雙向）從64 GB/s提升到了128 GB/s；目前規范制定已迭代至6.0版本，帶寬再翻倍。 異構計算的初步創新：在

2023-06-19 11:26:23

389

DPU軟件棧五層模型系列（一）DPU異構計算架構五層開發模型

一般說來，異構計算的核心目的是解決特定應用場景下算力不足的問題，并且大幅度提升整體系統的計算性能。在整體架構上，它的分層邏輯從應用場景出發，通過上層的需求來定義下層的功能，而每一層是對特定功能的抽象

2022-06-06 18:14:01

559

兆松科技CTO伍華林：RISC-V在異構計算中的機遇和挑戰

“RISC-V在異構計算中的機遇和挑戰”作主題演講。兆松科技（武漢）有限公司CTO伍華林異構計算主要是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式。伍華林指

2022-06-23 09:32:52

1205

異構計算面臨的挑戰和未來發展趨勢

導讀超異構和異構的本質區別在哪里？這篇文章通過對異構計算的歷史、發展、挑戰、以及優化和演進等方面的分析，來進一步闡述從異構走向異構融合（即超異構）的必然發展趨勢。1、異構計算的歷史發展1.1并行計算

2023-04-26 15:18:10

543

新一代計算架構超異構計算技術是什么異構走向超異構案例分析

超異構計算架構是一種將不同類型和規模的硬件資源，包括CPU、GPU、FPGA等，進行異構集成的方法。它通過獨特的軟件和硬件協同設計，實現了計算資源的靈活調度和優化利用，從而大大提高了計算效率和性能。

2023-08-23 09:57:02

408

什么是異構集成？什么是異構計算？異構集成、異構計算的關系？

異構集成主要指將多個不同工藝節點單獨制造的芯片封裝到一個封裝內部，以增強功能性和提高性能。

2023-11-27 10:22:53

1828

科學計算與Julia技術研討會 | 張先軼：從OpenBLAS到異構計算軟件棧

蓬勃發展，新興科學計算語言不斷涌現，Julia以其高性能、動態性成為其中的佼佼者。 12月9日上午1020 ，澎峰科技創始人張先軼博士將在主論壇：Julia與數字化和AI 上作 “ 從OpenBLAS到異構計算軟件棧” 主題演講，期待與大家見面！研討會完整詳細議程原文標題：科學計

2023-11-30 19:35:01

371

高通NPU和異構計算提升生成式AI性能?

異構計算的重要性不可忽視。根據生成式AI的獨特需求和計算負擔，需要配備不同的處理器，如專注于AI工作負載的定制設計的NPU、CPU和GPU。

2024-03-06 14:15:56

144

已全部加載完成

搜索歷史

異構計算為什么會異軍突起？基于FPGA的異構計算討論

評論

異構計算為什么會異軍突起？基于FPGA的異構計算討論