吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從不同角度更深入的了解Tesla的FSD芯片

電子工程師 ? 來源:lq ? 2019-04-29 10:09 ? 次閱讀

在近日結束的Tesla Autonomy活動中,Tesla非常“大方”的介紹了自己的Full Self-Driving (FSD) Computer從系統到芯片的很多細節。從芯片來看,其“透明度”超過了除Google第一代TPU之外所有的AI相關芯片。實際上,和Goolge TPU的情況類似,在這次發布之前,Tesla也做了一定的專利布局,這正好讓我們可以從不同角度更深入的了解Tesla的FSD芯片。

▌時間線

Tesla自動駕駛芯片負責人Pete Bannon首先介紹了芯片研發的過程:

Feb. 2016:第一個團隊成員入職;

Aug. 2017:第一版流片(經過18個月);

Dec. 2017:芯片返回,點亮;

Apr. 2018:BO Release to manufacturing;

Jul. 2018:Production start;

Dec. 2018:Employee retrofits start;

Mar. 2019:Model S & X production start;

Apr. 2019:Model 3 production start

用Pete的話說,從加入Tesla開始到芯片和系統在實際產品中部署,大約用了3年時間,這可能是他做過的項目中用時最短的了。他把這歸功于Tesla很強的垂直整合和并行工作的能力,還特別提到了Tesla有很強的Power supply design,Signal integrity design,Package design,System software,Board design,Firmware,System validation團隊。這里Tesla給了我們一個參考,即設計,生產和成功部署一顆SoC芯片所需付出的努力和時間。

▌系統和芯片設計

在具體介紹系統和芯片設計之前,Pete Bannon首先說了項目的前提,“只有一個客戶Tesla”,這就很大程度上降低了芯片需求的復雜性。總結起來,FSD芯片的需求就落到了如下幾點,依次是功耗,算力,Barch size(latency),安全性。在后面的Q&A中,Pete進一步提到Model 3的功耗的目標是每英里250W(Elon Musk對此作了補充,實際的功耗和道路環境有一定關系)。

source:Tesla

前面幾個需求主要反映在芯片設計上,而安全性則在系統層面也有很多考慮,比如大量的冗余設計。同一塊板卡上的兩顆芯片的供電和數據通道都是獨立且互為備份的。而一個很有趣的想法是兩顆芯片同時都對同樣的數據進行分析,然后對比分析結果(或者相互驗證),再得出最終結論。

source:Tesla

在這個地方Elon Musk還親自插進來講了一下這塊板卡上的任何部分如果出現故障都不會影響基本的汽車的行駛(他在之后的Q&A環節還補充說明了這一點)。

之后Pete Bannon就開始對芯片進行非常詳細的說明。首先是芯片的外觀,硅片和一些總體信息。后面的Q&A環節中透露了該芯片使用的是Samsung的14nm工藝。

source:Tesla

然后是SoC芯片的基本組成部分,CPU(12核A72),GPU,各種接口,片上網絡。這些部分都是采用第三方標準IP。

source:Tesla

此外還專門強調了一個SAFETY SYSTEM(如下圖所示),是一個獨立的CPU,有最終的控制權。

source:Tesla

當然,芯片中自研的最重要的部分是Neural Network Processor,也是發布中重點介紹的內容。首先是整體信息,每顆芯片有兩個NNP,每個NNP有一個96x96個MAC的矩陣,32MB SRAM,工作在2GHz。所以一個NNP的處理能力是96x96x2(OPs)x2(GHz) = 36.864TOPS,單芯片72TOPS,板卡144TOPS。

source:Tesla

這里比較值得注意的片上SRAM的數量。如果我們對比Google的初代TPU(256 x 256MAC,24MiB SRAM),這個片上存儲的數量是相當高的。從下圖也可以看到NNP中存儲器大概占了總面積3/4以上。Pete Bannon的解釋是為了降低功耗,他們的設計目標是將所有的模型都能存儲在片上。精度的選擇是乘法8bit,加法32bit。

之后Pete Bannon介紹了芯片工作的方式,沒有太多新鮮的東西。讀256B activation和128B weight,經過變形和buffer,組合成96x96的乘加,然后在MAC矩陣中進行運算,最后結果shift out到專門的ReLU和Pool的硬件模塊,然后再以每周期128B的帶寬存回memory。由于MAC矩陣是96 x 96,所以在把數據輸入給MAC矩陣之前,需要做數據格式的變換。完成這一系列動作,總帶寬需求是1TB/Sec。考慮到所有數據都在片上SRAM中,這個帶寬比較容易滿足。

source:Tesla

Pete Bannon還提了一下控制邏輯功耗的問題,認為ICache,Register File和Control邏輯消耗的能量要遠比運算消耗的能量大,所以NNP的設計就盡量簡化了控制邏輯,只做運算。相應的,指令集比較簡單,只有8條指令:DMA Read,DMA Write,Convolution,Deconvolution,Inner-product,Scale,Eltwidth,Stop。編程模型(控制流)也非常簡單,完成一次運算只需配置4個信息。另外也介紹了編譯工具,這個基本也是常見的功能。

source:Tesla

最后,Pete Bannon給出了芯片的實際性能指標,2300 幀/秒,72W。當然我們并不知道這是運行什么網絡的結果。如果是講演中給出的如下示例網絡,每幀需要35GOPS,每秒是35x2300=80TOPS,即能達到55%左右的利用率。

source:Tesla

到此我們看到了FSD芯片的一些細節,但還不足以充分了解它的架構設計。實際上,在這次公開之前,Tesla是給NNP申請了一系列專利的[2],我們可以從中看到一些更詳細的東西。

▌專利布局

Tesla目前公開的專利,大體的思路和Google之前給TPU申請專利也是差不多的(Google的神經網絡處理器專利),先申請整體框架和方法的專利,然后是具體運算,數據格式準備,Vector處理,包括下面幾個。

Accelerated Mathematical Engine(Sep. 2017)

Computational Array Microprocessor system with variable latency memory access(Mar. 2018)

Computational array microprocessor system using non-consecutive data formating(Mar. 2018)

Vertor Computational Unit(Mar. 2018)

這里先要說明一下,專利和實際實現可能是有很大差別的。我們對專利的閱讀主要是作為對比和參考。下面我們主要看一下第一個專利,即整體架構和方法的專利。雖然這里的名字叫“ACCELERATED MATHEMATICAL ENGINE”,但權力要求里的說法是,“A matrix processor for accelerating convolutions in a neural network”,基本就是一個CNN加速器。

它的基本硬件架構主要是圍繞一個大的矩陣處理器(MATRIX PROCESSOR)做文章(如下圖)。

source:Tesla patent “ACCELERATED MATHEMATICAL ENGINE”

Data和Weight分別經過一個FORMATTER進行格式的轉換,存入BUFFER,之后有一個硬件電路讀出提供給矩陣處理器。專利中提到FORMATTER可以用軟件或者硬件實現,它們實際芯片中應該是硬件實現的。由于要有效利用這種規模(96x96)的MAC矩陣,必須把輸入數據排好,這個FORMATTER起到了很大作用。因此他們也專門對它申請了專利(Google也是類似情況),有興趣的同學也可以看看。

在完成了矩陣乘加運算后,結果會移出(shift)矩陣處理器(根據專利里的描述,應該是從上向下逐級移動)進行后續處理,包括累加,ReLU,和Pooling。由Vector Engine和Post-Processing Unit完成。這部分也有專門的專利(申請時間要晚一些),表述上和主架構專利似乎有點不一致。此外就是控制邏輯部分,這部分是一個盡量簡單的設計。

下面我們進入矩陣處理器(MAC Array)內部看看運算單元的設計。

source:Tesla patent “ACCELERATED MATHEMATICAL ENGINE”

對比一下Google的專利中的計算單元,

source:Google patent “NEURAL NETWORK PROCESSOR”

可以看出主要的區別在于Tesla多了一級累加器ShiftAcc,支持的數據流也能更靈活一些。總得來說,Tesla描述的架構和Google TPU專利描述的NNP("Neural network processor")是類似的,不過看起來在設計和表述上更為完整。在具體實現上,一個主要區別在于,FSD芯片主要使用片上SRAM工作,而不像是Google TPU還需要使用片外的DRAM。當然,還是那句話,專利不代表具體實現,而且Google的專利要早很多。這里只是單純參考一下。

▌Q&A環節的花絮

回到Tesla的活動,在芯片發布之后還進行了Q&A環節,這部分其實也很有意思。首先,Elon Musk說了如下一段話(大意),“我們今天之所以要提供如此詳細的信息,就是因為,在一開始,對于Tesla這樣從沒做過芯片的公司來說,要研發一顆世界最先進的芯片看起來是不可能的。我們的目標就是這樣,而且我們的目標不僅僅是領先一點,而是大幅度的領先。”從這段話可以看出,Tesla自研芯片應該是有必要性和能力上的質疑的。對于系統和應用廠商來說,這種質疑也是很正常的。

必要性比較容易講,如問答環節所說,Telsa如果每年賣上百萬輛車,而自研芯片能讓整車成本降低,當然就值得去做。而針對芯片研發的能力的質疑,這次發布算是一個回答。

所以,雖然這顆芯片目前還談不上世界領先(指標上和Nvidia的對比是不太科學的,這個Nvidia已有回應),Musk也要硬著頭皮去說。從另一個角度,這顆芯片至少可以證明自研的可行性。而且Musk也很認真強調了這套系統的優勢在于它的軟硬件都是專門為Tesla的自動駕駛定制的。對比Nvidia,他是這么說的,“Nvidia is great company, but they have many customers, as they apply their resources, they need to do a generalized solution. We care about one thing so private. It was designed to do that increadibly well and the software was also designed runing on that hardware increadibly well. The combination of hardware and software I think is unbeatable.” 看起來Tesla會在這條路上繼續走下去。在被問道工藝問題的時候,Elon Musk專門提到下一代芯片正在研發當中(已經halfway done)。

在被問道是否使用Lidar,Elon Musk說“lidar is fool's errand, anyone luck reliant on lidar is doomed.”在后面關于神經網絡和軟件的talk里,AI網紅Andrej Karpathy也解釋了這個觀點,"Lidar只是回避了關鍵的圖像識別問題,只是給我們一個技術進步的假想,雖然可以做一些快速DEMO,最終肯定失敗"。

還有一個關于實際路測和仿真的問題,Elon Musk說,“Tesla也做很好的仿真,不過還是很難模擬真實環境發生的各種情況,如果仿真環境能夠模擬真實情況(這里他頓了一下)我們也不知道自己是不是生活在仿真環境中。”好像他確實認真的感知了一下。

▌總結

Tesla的自動駕駛芯片是FSD系統的最重要部分,其對標的產品應該是Nvidia的Nvidia Xavier SoC芯片(參考Hot Chips 30 - 巨頭們亮“肌肉”中相關部分)。客觀來看,Tesla的芯片和NvidiaXavier SoC芯片在各方面還是有差距的。Tesla的SoC設計中,除了自研的Neural Network Processor部分之外,其它都是用業界標準IP,并沒做太多定制工作,只能說中規中矩。而NNP也是一個比較簡單的架構,也很難說做了很多架構和技術上的創新。從另一個角度來看,這款芯片如果真的大量使用了,那它至少也是合格的。可以看到,Tesla的目標和執行策略是清晰和實際的,這是系統廠商自研芯片的最大優勢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    51192

    瀏覽量

    427340
  • 特斯拉
    +關注

    關注

    66

    文章

    6332

    瀏覽量

    126822
  • 自動駕駛
    +關注

    關注

    785

    文章

    13932

    瀏覽量

    167017

原文標題:深度解析:特斯拉「最強」自動駕駛芯片?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何為不同的電機選擇合適的驅動芯片?納芯微帶你深入了解

    在現代生活中,電機廣泛使用在家電產品、汽車電子、工業控制等眾多應用領域,每一個電機的運轉都離不開合適的驅動芯片。納芯微提供豐富的電機驅動產品選擇,本期技術分享將重點介紹常見電機種類與感性負載應用,幫助大家更深入了解如何選擇合適的電機驅動
    的頭像 發表于 12-23 09:58 ?434次閱讀
    如何為不同的電機選擇合適的驅動<b class='flag-5'>芯片</b>?納芯微帶你<b class='flag-5'>深入了解</b>!

    深入了解示波器

    深入了解示波器
    發表于 11-14 22:32

    天下武功唯快不破,單片機編程技法唯高深才能更深入

    `天下武功唯快不破,單片機編程技法唯高深才能更深入!,帶您走入單片機編程技法的覺悟之旅!購買聯系:qq790861133(驗證消息:goumaimcu) 地址 dianzi001。taobao。com`
    發表于 01-03 11:27

    關于特斯拉自動駕駛FSD芯片NPU你想知道的都在這

    關于特斯拉自動駕駛FSD芯片NPU你想知道的都在這
    發表于 06-17 06:41

    從不同方面深入介紹降壓、升壓和降壓-升壓拓撲結構

    在本篇文章中,主要從不同方面深入介紹降壓、升壓和降壓-升壓拓撲結構。
    的頭像 發表于 01-10 11:33 ?1.1w次閱讀
    <b class='flag-5'>從不</b>同方面<b class='flag-5'>深入</b>介紹降壓、升壓和降壓-升壓拓撲結構

    AR和VR將能讓人們從不同的角度體驗這個世界

    AR和VR除了可以在游戲上使用之外,它還有能力成為一個同理心孵化器,讓用戶有機會站在另一個人的立場上。可能是異性,可能是殘疾人,也可能是與你觀點不同的人。通過AR和VR,我們將能夠從不同的角度體驗這個世界。
    發表于 12-09 09:11 ?2794次閱讀

    深度解析Tesla FSD自動駕駛芯片

    芯片來看,其“透明度”超過了除Google第一代TPU之外所有的AI相關芯片。實際上,和Goolge TPU的情況類似,在這次發布之前,Tesla也做了一定的專利布局,這正好讓我們可以從不
    的頭像 發表于 04-29 13:44 ?1.7w次閱讀

    Tesla自動駕駛芯片負責人Pete Bannon介紹芯片研發的過程

    Tesla Autonomy活動中,Tesla非常“大方”的介紹了自己的Full Self-Driving (FSD) Computer的很多細節。
    的頭像 發表于 04-29 15:42 ?3654次閱讀

    Tesla“大方”介紹自己的Full Self-Driving (FSD) Computer

    在剛剛結束的Tesla Autonomy活動中,Tesla非常“大方”的介紹了自己的Full Self-Driving (FSD) Computer從系統到芯片的很多細節。
    的頭像 發表于 04-29 17:22 ?7149次閱讀
    <b class='flag-5'>Tesla</b>“大方”介紹自己的Full Self-Driving (<b class='flag-5'>FSD</b>) Computer

    帶你深入了解示波器

    帶你深入了解示波器
    發表于 02-07 14:26 ?19次下載

    深入了解角度傳感器

    角度傳感器是指能感受被測角度并轉換成可用輸出信號的傳感器。?角度傳感器,顧名思義,是用來檢測角度的。
    的頭像 發表于 12-15 11:47 ?1772次閱讀
    <b class='flag-5'>深入了解</b><b class='flag-5'>角度</b>傳感器

    深入了解安全光柵

    深入了解安全光柵
    的頭像 發表于 06-25 13:53 ?1271次閱讀
    <b class='flag-5'>深入了解</b>安全光柵

    孔環是什么?深入了解孔環有助于實現PCB設計

    本文將探討孔環,因為更深入了解孔環有助于確保成功地實現PCB設計。
    的頭像 發表于 07-19 10:21 ?5182次閱讀
    孔環是什么?<b class='flag-5'>深入了解</b>孔環有助于實現PCB設計

    深入了解 GaN 技術

    深入了解 GaN 技術
    的頭像 發表于 12-06 17:28 ?6252次閱讀
    <b class='flag-5'>深入了解</b> GaN 技術

    特斯拉FSD自動駕駛系統“將入華”的消息仍在持續發酵

    據報道,推特網友Tesla China Analyst在午間發文透露,FSD預計將在未來兩周內進入我國市場,其附帶一張車載系統界面的照片作為佐證。
    的頭像 發表于 02-28 16:09 ?744次閱讀
    百家乐有作弊的吗| 百家乐赌台| 欢乐谷娱乐城开户| 百家乐官网l23| 百家乐电脑游戏机投注法实例| 爱婴百家乐官网的玩法技巧和规则| 百家乐平台注册| 百家乐官网心态研究| 太阳城百家乐优惠| 尊龙国际开户| 实战百家乐官网十大取胜原因百分百战胜百家乐官网不买币不吹牛只你能做到按我说的.百家乐官网基本规则 | 东阳市| 百家乐是片人的吗| 大赢家娱乐| 24山方向上| 伯爵百家乐赌场娱乐网规则| 百家乐官网技术下载| 网上百家乐平台下载| 达州市| 百家乐电话投注怎么玩| 利博国际| 太阳百家乐3d博彩通| 彩票游戏| 百家乐的打法技巧| 网上赌博游戏| 百家乐软件官方| 利来国际娱乐网| 百家乐金海岸娱乐| 葡京百家乐官网注码| 至尊百家乐年代| 百家乐官网存在千术吗| 赌百家乐的计划跟策略| 澳门百家乐官网秘积| 赌球记| 喜来登百家乐官网的玩法技巧和规则 | 百家乐官网书| 威尼斯人娱乐欢迎您| 百家乐官网游戏教程| 大发888casino组件下载| 总格24名人| 百家乐官网视频多开|