向量擴展將定稿,RISC-V機器學習的崛起
RISC-V作為一個與x86和Arm相比仍算年輕的架構,自然需要不少擴展模塊來完善其指令集架構,尤其是對標x86與Arm的SIMD指令集。然而SIMD指令集隨著時間的發展變得越來越臃腫,讓架構變得愈發復雜,David Patterson也在幾年前的一篇文章中寫道,實現數據級并行性更優雅的方式就是向量架構,RISC-V的向量擴展(RVV)也應運而生。
在機器學習算法中,向量被廣泛用于處理數據集和數組。而RVV為基礎指令集新增了多個向量寄存器和向量指令,可以讓基于RISC-V架構的處理器核心處理數組,與傳統的標量運算一起來加速大數據集的指令運算。
RISC-V向量擴展指令于2018年推出,在經過了多個版本的迭代后,終于在幾天前進入了1.0 PB狀態。RVV工作組認同了1.0版本的穩定性,已經可以在上游軟件項目中開發相關的工具鏈、功能模擬器與實現了。而前段時間的RISC-V論壇,也展示了RISC-V在向量與機器學習上的進展。
RISC-V機器學習用于太空應用
相信不少人都注意到近期逐漸增加的各項太空探索任務,比如祝融號火星車與中國空間站建設等,這些任務中AI與機器學習的應用也開始出現。然而將AI與機器學習加入太空任務依舊面臨著諸多挑戰,比如已有的太空處理器已經無法跟上AI與ML的計算需求,但現成的商用設備既無法滿足輻射要求,也沒有太空認證的軟件棧支持。
來自加泰羅尼亞理工大學和巴塞羅那超算中心的兩位研究員Leonidas Kosmidis和Marc Solé Bonet給出了他們的創新方案,實現了在功率有限的RISC-V處理器上加速ML運算。與采用額外大面積向量寄存器文件的傳統方式不同,他們采用了一個開源的短SIMD模塊通過重復利用整數寄存器文件來減小面積。這一方案以2個未使用的RISC-V操作碼實現了17個高度可配置的定制指令,可以用于實現ML應用中200多種組合運算。
他們成功將該模塊移植到了Cobham Gaisler開發的開源RISC-V太空處理器NOEL-V上,在最小的NOEL-V處理器的配置下進行通用ML程序的測試,得出的結果相當可觀。只需多用到25%的面積,就能實現3到7倍的性能提升,還不會影響到處理器的頻率。
兩位研究員也實現了Gaisler另一個太空處理器LEON3的版本,該處理器采用的是SPARC V8的架構。未來他們還計劃引入TensorFlow和編譯器代碼生成等一系列軟件支持,并在歐洲航天局OPS-SAT實驗衛星上的FPGA上進行測試。
RISC-V向量處理器的真正挑戰
90年代可以說是DSP、CISC與DSP三家爭霸的狀態,然而到了21世紀,DSP已經越來越難突破GHz,而高頻CPU中乘積累加運算單元的流行使得DSP在性能上敗下陣來。而RISC與CISC相比的優勢在于其簡單化的特性,更容易實現高頻率。然而在向量處理器(VPU)上,必須要解決數據傳輸的問題。
![](https://file.elecfans.com/web2/M00/15/BE/poYBAGFNMA2ARV4WAAKSfMTKSDI598.png)
傳統VPU在帶寬上的瓶頸 / 晶心科技
從數據傳輸的流程來看,系統總線已經被處理器占用處于繁忙狀態,而所有數據都通過緩存走向總線,現在又多出了向量指令和向量數據,致使總線到內存的延遲增加,整體性能下降。因此,提高總線帶寬的同時保持高頻率,又不會增加額外的功耗也就成了一大設計挑戰。傳統的解決方案有預讀取和更大的獨立內存與緩存等,但往往需要犧牲功耗和尺寸。
晶心科技為了解決這一挑戰,推出了晶心自定義擴展(Andes Custom Extension,ACE),這一RISC-V擴展可以創造新的指令、新的協處理器和新的內存位置。ACE引入了全新的Streaming Port,為外部硬件引擎創造了自定義數據接口和自定義數據內存,以很小的功率代價解決了數據傳輸問題。除此之外,ACE還可以用于數據預處理與后處理,比如格式轉換等,進一步提升VPU的性能,更好地控制和管理外部加速器。
結語
RISC-V在向量擴展與處理器上的進展已經相當驚人,要知道蘋果在前段時間招募RISC-V開發者的工作描述中,不僅要求掌握RISC-V的開發知識,還要求了解Arm NEON SIMD微架構的向量編程。隨著RVV的定稿,向量寄存器與指令也將全部確定下來,屆時相關的編譯器等工具鏈也能夠及時做到兼容。
RISC-V作為一個與x86和Arm相比仍算年輕的架構,自然需要不少擴展模塊來完善其指令集架構,尤其是對標x86與Arm的SIMD指令集。然而SIMD指令集隨著時間的發展變得越來越臃腫,讓架構變得愈發復雜,David Patterson也在幾年前的一篇文章中寫道,實現數據級并行性更優雅的方式就是向量架構,RISC-V的向量擴展(RVV)也應運而生。
在機器學習算法中,向量被廣泛用于處理數據集和數組。而RVV為基礎指令集新增了多個向量寄存器和向量指令,可以讓基于RISC-V架構的處理器核心處理數組,與傳統的標量運算一起來加速大數據集的指令運算。
RISC-V向量擴展指令于2018年推出,在經過了多個版本的迭代后,終于在幾天前進入了1.0 PB狀態。RVV工作組認同了1.0版本的穩定性,已經可以在上游軟件項目中開發相關的工具鏈、功能模擬器與實現了。而前段時間的RISC-V論壇,也展示了RISC-V在向量與機器學習上的進展。
RISC-V機器學習用于太空應用
相信不少人都注意到近期逐漸增加的各項太空探索任務,比如祝融號火星車與中國空間站建設等,這些任務中AI與機器學習的應用也開始出現。然而將AI與機器學習加入太空任務依舊面臨著諸多挑戰,比如已有的太空處理器已經無法跟上AI與ML的計算需求,但現成的商用設備既無法滿足輻射要求,也沒有太空認證的軟件棧支持。
來自加泰羅尼亞理工大學和巴塞羅那超算中心的兩位研究員Leonidas Kosmidis和Marc Solé Bonet給出了他們的創新方案,實現了在功率有限的RISC-V處理器上加速ML運算。與采用額外大面積向量寄存器文件的傳統方式不同,他們采用了一個開源的短SIMD模塊通過重復利用整數寄存器文件來減小面積。這一方案以2個未使用的RISC-V操作碼實現了17個高度可配置的定制指令,可以用于實現ML應用中200多種組合運算。
他們成功將該模塊移植到了Cobham Gaisler開發的開源RISC-V太空處理器NOEL-V上,在最小的NOEL-V處理器的配置下進行通用ML程序的測試,得出的結果相當可觀。只需多用到25%的面積,就能實現3到7倍的性能提升,還不會影響到處理器的頻率。
兩位研究員也實現了Gaisler另一個太空處理器LEON3的版本,該處理器采用的是SPARC V8的架構。未來他們還計劃引入TensorFlow和編譯器代碼生成等一系列軟件支持,并在歐洲航天局OPS-SAT實驗衛星上的FPGA上進行測試。
RISC-V向量處理器的真正挑戰
90年代可以說是DSP、CISC與DSP三家爭霸的狀態,然而到了21世紀,DSP已經越來越難突破GHz,而高頻CPU中乘積累加運算單元的流行使得DSP在性能上敗下陣來。而RISC與CISC相比的優勢在于其簡單化的特性,更容易實現高頻率。然而在向量處理器(VPU)上,必須要解決數據傳輸的問題。
![](https://file.elecfans.com/web2/M00/15/BE/poYBAGFNMA2ARV4WAAKSfMTKSDI598.png)
傳統VPU在帶寬上的瓶頸 / 晶心科技
從數據傳輸的流程來看,系統總線已經被處理器占用處于繁忙狀態,而所有數據都通過緩存走向總線,現在又多出了向量指令和向量數據,致使總線到內存的延遲增加,整體性能下降。因此,提高總線帶寬的同時保持高頻率,又不會增加額外的功耗也就成了一大設計挑戰。傳統的解決方案有預讀取和更大的獨立內存與緩存等,但往往需要犧牲功耗和尺寸。
晶心科技為了解決這一挑戰,推出了晶心自定義擴展(Andes Custom Extension,ACE),這一RISC-V擴展可以創造新的指令、新的協處理器和新的內存位置。ACE引入了全新的Streaming Port,為外部硬件引擎創造了自定義數據接口和自定義數據內存,以很小的功率代價解決了數據傳輸問題。除此之外,ACE還可以用于數據預處理與后處理,比如格式轉換等,進一步提升VPU的性能,更好地控制和管理外部加速器。
結語
RISC-V在向量擴展與處理器上的進展已經相當驚人,要知道蘋果在前段時間招募RISC-V開發者的工作描述中,不僅要求掌握RISC-V的開發知識,還要求了解Arm NEON SIMD微架構的向量編程。隨著RVV的定稿,向量寄存器與指令也將全部確定下來,屆時相關的編譯器等工具鏈也能夠及時做到兼容。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
處理器
+關注
關注
68文章
19409瀏覽量
231207 -
ARM
+關注
關注
134文章
9169瀏覽量
369247 -
RISC-V
+關注
關注
45文章
2324瀏覽量
46605
發布評論請先 登錄
相關推薦
關于RISC-V芯片的應用學習總結
的核心優勢在于其開源性、模塊化、低功耗、高性能以及可擴展性。這些特性使得RISC-V芯片在物聯網(IoT)、嵌入式系統、邊緣計算以及高性能計算等領域具有獨特競爭力。
在物聯網領域,RISC-V芯片的低功耗
發表于 01-29 08:38
RISC-V 與 ARM 架構的區別 RISC-V與機器學習的關系
在現代計算機架構中,RISC-V和ARM是兩種流行的處理器架構。它們各自具有獨特的特點和優勢,適用于不同的應用場景。 1. RISC-V架構 RISC-V(讀作“risk-five”)是一種開源
關于RISC-V學習路線圖推薦
RISC-V簡介 :
了解RISC-V的起源、特點、優勢以及應用場景。
RISC-V指令集 :
學習RISC-V的基本指令集,如RV32I
發表于 11-30 15:21
什么是RISC-V?以及RISC-V和ARM、X86的區別
是開放的,任何人都可以使用它來開發處理器芯片和其他硬件,而無需支付任何許可或使用費用。RISC-V的設計簡單,易于擴展和自定義,可以在各種應用場景和市場中使用。
什么是指令集架構?
指令集架構
發表于 11-16 16:14
希姆計算的RISC-V矩陣擴展開源項目已升級至0.5版本,支持向量+矩陣的實現
希姆計算的RISC-V矩陣擴展開源項目已升級至0.5版本-----支持向量+矩陣的實現范福杰博士&陳煒博士項目背景Background為了解決RISC-V在人工智能領域中指令碎片化
![希姆計算的<b class='flag-5'>RISC-V</b>矩陣<b class='flag-5'>擴展</b>開源項目已升級至0.5版本,支持<b class='flag-5'>向量</b>+矩陣的實現](https://file1.elecfans.com/web2/M00/E5/D3/wKgaomZBeIyADEqiAACsZ19UYWk044.png)
RISC-V近期市場情況調研
RISC-V是一種開源的指令集架構(ISA),近年來在全球范圍內迅速崛起,尤其在中國,RISC-V的發展勢頭十分強勁。以下是目前RISC-V芯片的發展情況,以及中國在這一領域的主要公司
加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !
加入RISC-VAdvocate行列!我們正在尋找來自世界各地的RISC-V愛好者,通過全球推廣和參與,成為支持RISC-V進步的關鍵參與者。作為一名RISC-VAdvocate,您將
![加入全球 <b class='flag-5'>RISC-V</b> Advocate 行列,共筑 <b class='flag-5'>RISC-V</b> 的未來 !](https://file1.elecfans.com/web2/M00/E5/D3/wKgaomZBeIyADEqiAACsZ19UYWk044.png)
RISC-V指令集的特點總結
各種應用場景,從嵌入式系統到高性能計算,都可以通過添加專門的指令擴展來優化性能。
分層設計
定義:RISC-V 架構采用了分層設計方法,基本指令集可以通過額外的擴展層來增強功能,如浮點運算、向
發表于 08-30 22:05
RISC-V適合什么樣的應用場景
設計使得開發者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統的各種性能要求。
3. 人工智能(AI)和機器學習(ML)
高性能計算:RISC-V結合AI加速器或協處理器,可以提供高效的人工智能計算
發表于 07-29 17:16
為什么要有RISC-V
的,永遠不會改變。這為編譯器編寫者,操作系統開發人員和匯
編語言程序員提供了穩定的目標。模塊化來源于可選的標準擴展,根據應用程序的需要,硬件可以包含或不包含這些擴展。這種模塊化特性使得RISC-V具有了
發表于 07-27 15:05
risc-v多核芯片在AI方面的應用
應用中的成本。
最后,RISC-V多核芯片不僅可以應用于AI邊緣計算領域,還可以擴展到其他領域,如數據中心、云計算、自動駕駛、機器人等,為這些領域提供高效、靈活和安全的解決方案。
總的來說,R
發表于 04-28 09:20
RISC-V 基礎學習:RISC-V 基礎介紹
是什么?
RISC-V 是一套開放許可證書、免費的、由基金維護的、一個整數運算指令集外加多個擴展指令集的CPU 結構規范(ISA)。
整數運算指令集 + 擴展指令集
任何硬件開發商或者組織都可以
發表于 03-12 10:25
學習RISC-V單片機的感想
RISC-V,以及國內開始的自研其它架構單片機。國內有些企業自研的架構,還沒有機會學習和使用。期待有機會試試,比如華為的處理器、龍芯等。現在使用最多的還是51的和ARM的。ARM的一直都在不斷發展中,有各種
發表于 02-17 21:00
評論