Arm Neoverse V1 性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)現在可以下載了,它可以幫助您為基于V1的產品系統優(yōu)化應用程序代碼。
白皮書是對上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵蓋了從N1到V1內核的新功能和更新。此資源可用于了解和優(yōu)化V1平臺上應用程序的性能。
為了充分利用您花費的分析和優(yōu)化時間,選擇正確的PMU事件并遵循具有用戶友好軟件度量的結構化方法是非常重要的。在白皮書中,我們介紹了Neoverse V1的Arm自頂向下分析方法。
在本博客中,我們概述了從N1到V1內核的更新,并概述了本白皮書的內容。我們還引用了其他有用的資源,以充分利用Neoverse V1平臺。
ArmNeoverse V1支持自上而下的1級指標。
Arm Neoverse V1平臺是第一個Arm核心,為自上而下的方法學1級指標支持全套事件和指標。這些指標對于性能分析和優(yōu)化是一個巨大的增值。
這些指標提供了SLOT級別處理器流水線利用率的詳細細分,從而能夠評估處理器效率和識別瓶頸。該功能是Arm Neoverse V1平臺性能分析功能的一個主要增強,此外還有其他可用于進一步分析的微架構探索指標。
Arm Neoverse V1遙測規(guī)范:性能分析的事件和指標。
Arm Neoverse V1遙測規(guī)范,包括軟件產品特定事件描述和衍生分析指標,可在Arm Neovere V1性能分析方法白皮書附錄B和C中找到。
Arm遙測解決方案庫
白皮書中引用的機器可讀JSON文件中提供的遙測數據和壓力工作負載套件現在可以在GitLab遙測解決方案庫(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。
Neoverse V1 PMU事件和指標備忘單
在這個過程中,熟悉Arm Neoverse微體系結構,包括其復雜的管道和多級內存層次結構,可能會有所幫助。由于Neoverse內核提供了100多個硬件計數器可供選擇,因此確定重點關注的事件的優(yōu)先級非常重要。為了幫助完成這項任務,我們創(chuàng)建了列出事件及其相應派生度量的備忘單。
表1。Neoverse V1核心活動備忘單
主要參考文獻
以下兩份文件提供了對Neoverse V1進行性能分析所需的所有信息,是我們推薦的參考文件:
1) Arm Neoverse V1性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮書介紹了一種性能分析方法,并介紹了如何在Arm Neovere V1平臺上進行工作負載表征。這是對上一篇Neoverse N1白皮書的更新,該白皮書介紹了性能分析方法,并展示了如何在Arm Neoverse N1平臺上進行工作負載表征。如果您是Arm平臺和性能分析工具(如Linuxperf)的新手,我們建議您先閱讀本白皮書。
2) Arm Neoverse V1 PMU指南(直接下載):本文檔全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架構和架構細節(jié)。
Arm Neoverse V1核心
Arm Neoverse V1是一個核心,旨在為苛刻的云、HPC和AI/ML輔助工作負載提供最大的單線程性能。Neoverse V1是第一個包含可擴展向量擴展(SVE)的Neoverse處理器,可實現最大向量性能、HPC代碼重用和使用壽命。Neoverse V1支持Bfloat16和Int8 MatMul指令。與Neoverse N1相比,這些指令可以為TensorFlow、PyTorch、OneDNN等機器學習框架提供高達3倍的性能。Neoverse V1 CPU目前可用于AWS EC2實例,由AWS Graviton3和AWS Graviton 3E處理器提供支持。
結論
我們自上而下的方法分析和遙測規(guī)范現在可用于Neoverse V1平臺。我們將很快開始將這些信息上傳到Linux perf工具。V系列內核,如V1,旨在在Neoverse系列CPU IP中提供最大的單線程性能。Neoverse V1性能分析方法白皮書和V1 PMU指南可以幫助開發(fā)人員從V1架構中獲得最大性能。我們鼓勵所有使用基于V1的平臺(包括AWS Graviton3和Graviton3E)的開發(fā)人員學習和使用它。
白皮書下載地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf
審核編輯 :李倩
-
處理器
+關注
關注
68文章
19406瀏覽量
231163 -
ARM
+關注
關注
134文章
9165瀏覽量
369165 -
應用程序
+關注
關注
38文章
3292瀏覽量
57911
原文標題:Arm Neoverse V1–性能分析和遙測規(guī)范的自頂向下方法
文章出處:【微信號:Arm軟件開發(fā)者,微信公眾號:Arm軟件開發(fā)者】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
深度解析Neoverse V1對Arm的重要意義
![深度解析<b class='flag-5'>Neoverse</b> <b class='flag-5'>V1</b>對<b class='flag-5'>Arm</b>的重要意義](https://file.elecfans.com/web1/M00/EF/C5/o4YBAGCk3ZOAPvG9AASLiRlLuME833.png)
Arm Neoverse家族新增V1和N2兩大平臺,突破高性能計算瓶頸
基于自頂向下技術的工程機械Digital Prototyping設計方法及應用
Arm Neoverse V1的AWS Graviton3在深度學習推理工作負載方面的作用
ARM Neoverse N1 Core性能分析方法
Arm Neoverse V1 PMU指南
Arm Neoverse? N1 PMU指南
ARM Neoverse?V1參考設計軟件開發(fā)人員指南
互聯網巨頭紛紛啟用Arm CPU架構,Arm最新Neoverse V1和N2平臺加速云服務器芯片自研
計算機網絡:自頂向下
eda自頂向下的設計方法 eda自頂向下設計優(yōu)點
Arm新Arm Neoverse計算子系統(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3
![<b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>計算子系統(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS <b class='flag-5'>V</b>3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3](https://file1.elecfans.com//web2/M00/D8/B8/wKgaomYo1pyAWmiUAAC0n-JZNkM304.jpg)
評論