吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

論AI的系統廠商vs系統廠商的AI

SDNLAB ? 來源:SDNLAB ? 2023-11-14 17:27 ? 次閱讀

01

前 言

10月初Dell在Austin的一個event “Bring AI to Your Data”宣傳上,科技媒體65請了Dell 的一個VP來討論,在討論中一向比較直接的Patrick就問了一個所有系統廠商的靈魂問題:“Dell 在AI的軟件和算法上沒有投入,在AI加速的芯片上也沒有投入,你們在談AI到底在談啥?”。好在是VP比較機靈,先談“Dell是個大公司,客戶多,很多客戶不知道AI是個啥,Dell可以提供H100的GPU服務器,然后就是AI肯定要存儲的,因為大數據要靠AI,數據的保護和管理,bablbabl.。.“。說實在的,如果AI的數據真的很重要的話。Samsung和Seagate應該是世界上市值最高的AI公司了。關心股市的同學知道,在這個宇宙中并不是。

俺是正統的系統廠商出身,畢業實習的時候在華騰(就是那個天騰和華東計算機所合資)做系統集成,很巧的是在俺公司現址的樓下,一天被當年帶的新畢業生認出來,當年的畢業生已經是華騰的CTO了,在華騰工作了24年,從系統集成公司進化成上萬人外包的大公司了。其實,在X86興起的200X年代,互聯網還在融資,系統集成公司的日子還是不錯的,企業客戶都面臨這個信息化這個話題,系統集成公司是軟硬一體的,可以像Dell今天滿足客戶AI需求一樣滿足客戶的信息化需求。

當互聯網興起之后,系統集成公司的日子基本上到頭了,互聯網只要硬件,人家有的是軟件工程師。后面,隨著SSD出現,高速網絡出現, intel手下的系統公司基本上被臺廠,后面被互聯網的系統部全部踢出局了。當然,俺早早的跳出這個領域,向下做到了SSD部件廠商,以至于前一段一個哥們問我服務器還是啥搞頭,俺可是在聯想,Dell做了快10年的服務器的人,居然真的想不出來服務器還能有啥花頭。

02

緣 起

回到正題, AI從2012年開始,基本上起起伏伏快10年了,在Nvidia面臨游戲和加密貨幣的下滑的雙重打擊下,GPTx異軍突起,讓老黃放飛了自我。就像前面講的一樣,AI的投資基本上在AI的網絡算法和AI加速器兩個方向。為啥這次LLM只是火了AI算法,但是一票AI加速器公司反而悄無聲息?原因也很簡單,就像在Meta做AI Infra的Dr. Kim Hazelwood講的一樣,在AI的框架世界中,高效的框架是打不過好用的框架的,因為對算法工程來講,2小時和12小時沒有區別,反正下班前提交了,只要明天上班的時候能出來就行。

因此,在AI框架的競爭中,Pytorch戰勝了TensorFlow【1】。

a75d344e-820b-11ee-939d-92fbcf53809c.png

對了,Pytorch就是Meta的,前面的計算機科學家Kim的評論(2020)圓滿了。而Pytorch的特點就是好用,有2000+ 算子,這個對于AI加速器來講就是滅頂之災。之前那些學Google TPU做脈動整列的,做Tensor/Vector加速的startup基本上被強大的CUDA打趴下了。

a76c398a-820b-11ee-939d-92fbcf53809c.jpg

但是,如果是這樣的話,就沒有本文的標題了,在硅谷走老黃的路的公司基本都沒有了,只有中國還在和A股互動炒作GPU的概念,而真正可以對標老黃的公司都不是走GPU的路線。反而是兩家做可編程DataFlow的公司成為了熱點,而且都是AI的系統公司。

03

Sambanova

a77dfdc8-820b-11ee-939d-92fbcf53809c.png

Kunle Olukotun的名號是“Father of The Mutil-Core Processor”,之前的公司是Afara Websystem,做最早的多核系統。

a78d7528-820b-11ee-939d-92fbcf53809c.png

從這一頁,看不懂Niagara的同學可以勸退了。看懂的童鞋可以點贊了。這么老的古董,現在散落在不同的公司的Sun可以緬懷一分鐘。

a7adff64-820b-11ee-939d-92fbcf53809c.png

另一個大佬是Chris,主要是做軟件的,公司被Apple收購。

a7bc9448-820b-11ee-939d-92fbcf53809c.png

做多核CPU和做大數據管理的在一起,故事很直接。ML Application就是Software 2.0呀。

a7d23550-820b-11ee-939d-92fbcf53809c.png

2019年回來的芯片很大很大,比GPU還大,725mm2。4個DDR4 controller支持1.5T。64Lane PCIe Gen4.0 做單機8卡互聯。(不錯,我們是I/O控)。

a7e0d8f8-820b-11ee-939d-92fbcf53809c.png

這張圖說明了,2019年已經tapeout的片子,現在剛剛熱起來。編譯器的能力,特別是可編程的并行能力,需要時間呀。

a7f830e8-820b-11ee-939d-92fbcf53809c.png

芯片上的主要部分,和大部分AI加速器類似,計算單元,SRAM做weight/gradient的保存, AGU和SU做數據路由,CU就是控制了。

a8056970-820b-11ee-939d-92fbcf53809c.png

單機8卡,和老黃對標。

a80f2820-820b-11ee-939d-92fbcf53809c.png

a82aad20-820b-11ee-939d-92fbcf53809c.png

產品文檔很全面,有自己的編譯器和開發環境。硬件也是用AMD的PCIe的標準服務器帶8個加速器。其中的HCI就是自己互聯的方案,基于PCIe Gen4,從接口的形態看應該是4口一組的PCIe HBA類似。

a84bdca2-820b-11ee-939d-92fbcf53809c.png

a8590490-820b-11ee-939d-92fbcf53809c.png

HCI組網方式基本上就是full mesh,4個計算節點互聯和頭節點互聯。 節點之間的連接還有用RoCEv2的Ethernet以及junper的交換機。只是HCI沒有用PCIe switch,看cable做pointer to pointer的互聯,可能和NVLinkv1一樣,沒有做NVSwitch。

a86fde68-820b-11ee-939d-92fbcf53809c.png

作為AI的系統廠商來講,Sambanova還是很不錯的,除了一些美國的國家實驗室以外,還有一些做金融和文本處理的公司。而且關鍵是2代的芯片也回來了,支持HBM, 支持5T的LLMs【2】。

a887b83a-820b-11ee-939d-92fbcf53809c.png

04

Cerebras

說到這家,必須講它的出處 SeaMicro. 對,下圖就是8個server在一個5X11英寸的PCB上。它是ARM進軍數據中心的先烈,被AMD收購了,被Lisa SU殺死了。這種類型的板子,我當年在DCS的時候也搞過類似的低功耗MicroServer。

a8aaa1ba-820b-11ee-939d-92fbcf53809c.png

Cerebras的核心人物都是SeaMicro的背景。

a8bfee6c-820b-11ee-939d-92fbcf53809c.png

關于Cerebas,正好之前有材料,這里就快速總結了。

a8d7b1c8-820b-11ee-939d-92fbcf53809c.png

通過RoCEv2的RDMA進行系統擴展。weight的存儲和計算節點通過ethernet互聯。

a8ef27e0-820b-11ee-939d-92fbcf53809c.png

對于Weight節點獨立,很好地解決了GPU因為內存不夠出現的data 并行的問題,在大模型時代成了殺手锏。通過On-Chip Memory和MemoryX的流水線處理,很好地解決了之前GPU training中參數服務器的問題。

a90bf3de-820b-11ee-939d-92fbcf53809c.png

計算單元的設計還是軟硬結合,編譯器做調度編排,整個片子上網絡沒有中心的控制。

a91b68be-820b-11ee-939d-92fbcf53809c.png

最后,在LLMs時代,Pytorch的勝利邏輯會繼續。

a975516c-820b-11ee-939d-92fbcf53809c.png

相對于Sambanova, 因為Cerebras的步子更大,不僅在國家實驗室有落地,更加在LLMs時代找到了方向。

a9895b62-820b-11ee-939d-92fbcf53809c.png

05

尾 聲

在過去2016年AI的創業風潮起來之后,GPU的顛覆者到現在還沒有出現,的確讓人比較遺憾。后面的路會怎么走,我還是比較認可Andrej Karpathy的判斷, Transformers可能會走上模型的統一。

a9a665c2-820b-11ee-939d-92fbcf53809c.png

模型+數據+算力=ML Application, Chris指出的方向也許是AI創業公司盈利的方向???

回到正題,也許下一波就是AI公司成為AI系統廠商,或者系統廠商收購AI公司成為AI系統廠商的時代了。

a9b53a52-820b-11ee-939d-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 互聯網
    +關注

    關注

    54

    文章

    11187

    瀏覽量

    103875
  • AI
    AI
    +關注

    關注

    87

    文章

    31536

    瀏覽量

    270353
  • pytorch
    +關注

    關注

    2

    文章

    808

    瀏覽量

    13366

原文標題:論AI的系統廠商 vs.系統廠商的AI

文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【免費直播】AI芯片專家陳小柏博士,帶你解析AI算法及其芯片操作系統

    智慧化進程。人工智能芯片是人工智能發展的基石,是數據、算法和算力在各類場景應用落地的基礎依托。“無芯片不AI”已經深入人心,成為業界共識。本次直播將述說AI芯片設計帶你解析AI算法及其芯片操作
    發表于 11-07 14:03

    【免費直播】讓AI芯片擁有最強大腦—AI芯片的操作系統設計介紹.

    智慧化進程。人工智能芯片是人工智能發展的基石,是數據、算法和算力在各類場景應用落地的基礎依托。“無芯片不AI”已經深入人心,成為業界共識。本次直播將述說AI芯片設計帶你解析AI算法及其芯片操作
    發表于 11-07 14:18

    AI時代FPGA廠商與FPGA工程師要如何轉型?

    AI時代FPGA廠商與FPGA工程師該如何轉型?
    發表于 06-08 11:50

    開源的鴻蒙系統其他手機廠商會用嗎?

    ”危機。但即便如此,華為也將在這次開發者大會上直接將華為鴻蒙OS系統全球免費開源,這意味著華為鴻蒙OS系統2.0正式版也會被應用到更多的智能設備之中,不僅僅華為終端設備能用,就連其他國產廠商也都能夠
    發表于 09-24 10:42

    為什么需要嵌入式AI

    為什么需要嵌入式AI?嵌入式AI還有瓶頸半導體廠商的新商機
    發表于 01-22 06:14

    AI芯片最新格局分析 精選資料分享

    來源:中金公司,作者黃樂平、何枚與楊俊杰AI 芯片設計是人工智能產業鏈的重要一環。 自 2017 年 5 月以來,各 AI 芯片廠商的新品競相發布,經過一年多的發展,各環...
    發表于 07-23 07:08

    AI芯片最新格局分析 精選資料分享

    來源:中金公司,作者黃樂平、何玫與楊俊杰AI 芯片設計是人工智能產業鏈的重要一環。 自 2017 年 5 月以來,各 AI 芯片廠商的新品競相發布,經過一年多的發展,各環...
    發表于 07-23 07:14

    VS-AI-BC01的特點是什么?軟件如何配置?

    VS-AI-BC01的特點是什么?軟件如何配置?
    發表于 12-27 07:49

    【開發教程11】AI語音人臉識別(會議記錄儀-人臉打卡機)-AI語音系統架構

    CC3200AI實驗教程——瘋殼·開發板系列AI語音系統架構AI語音識別系統系統架構如圖1.0
    發表于 05-20 15:35

    【開發教程14】AI語音人臉識別(會議記錄儀-人臉打卡機)-AI人臉系統架構

    CC3200AI實驗教程——瘋殼·開發板系列AI人臉系統架構AI人臉識別系統由7大塊組成,分別是攝像頭、CC3200、串口調試助手、路由器、
    發表于 06-10 14:32

    【CC3200AI實驗教程11】瘋殼·AI語音人臉識別-AI語音系統架構

    CC3200AI實驗教程——瘋殼·開發板系列AI語音系統架構AI語音識別系統系統架構如圖1.0
    發表于 08-30 14:54

    【CC3200AI實驗教程14】瘋殼·AI語音人臉識別-AI人臉系統架構

    CC3200AI實驗教程——瘋殼·開發板系列AI人臉系統架構AI人臉識別系統由7大塊組成,分別是攝像頭、CC3200、串口調試助手、路由器、
    發表于 08-31 16:35

    已結束-【書籍評測活動】一本書,匯聚華為、曠視、高通等主流廠商AI技術

    ,各互聯網廠商、終端廠商和芯片廠商陸續推出了各種深度學習推理框架,用于在移動終端設備上通過設備的AI芯片運行人工智能推理任務,比如Google公司的TensorFlow Lite、華為
    發表于 01-31 09:30

    AI芯片的廠商進行歸納和整理

    眾所周知,人工智能的三大支柱是硬件、算法和數據。其中,硬件主要是指用于運行AI算法的芯片。本文主要對AI芯片的廠商進行歸納和整理。
    的頭像 發表于 12-25 15:52 ?4103次閱讀

    AI芯片Top15只有華為一家?國內AI芯片廠商去哪了?

    在全球知名調研機構Compass Intelligence的一份報告中,對當前致力于AI芯片的公司給出了一份排名:華為作為國內第一AI芯片廠商上榜,但在這份榜單中卻位居第12位。此外,國內AI
    的頭像 發表于 06-15 09:45 ?6317次閱讀
    百家乐怎么赢对子| 大发888在线娱乐下载| 亳州市| 属蛇和属马合作做生意谁吃亏| 威尼斯人娱乐城网址是什么| 百家乐官网有作弊的吗| 百家乐投注技巧建议| 金矿百家乐的玩法技巧和规则| 遂溪县| 百家乐的保单打法| 娱乐城大全| 黄金城百家乐官网免费下载| 大发888娱乐能借钱| 百家乐官网技巧打| 威尼斯人娱乐场有什么玩 | 威尼斯人娱乐城送宝马| 澳门百家乐官网网址| 澳门百家乐战法| 皇冠投注网| 百家乐长龙如何判断| 镇雄县| 百家乐高手的心得| 百家乐官网压分规律| 百家乐注册下注平台| 察哈| 百家乐技巧何为百家乐之路| 百家乐官网游戏必赢法| 百家乐群博乐吧blb8v| 百家乐官网去哪里玩最好| 永利百家乐赌场娱乐网规则| 哪个百家乐官网投注平台信誉好| 黄金百家乐的玩法技巧和规则| 百家乐官网现金网平台排行榜| 威尼斯人娱乐场55556| 百家乐官网好津乐汇| 德州扑克锦标赛| 百家乐合理的投注法| 百家乐官网的寻龙定穴| 博彩百家乐五2013124预测| 百家乐官网赌场破解| 德州扑克底牌|