亞馬遜宣布將人工智能處理遷移到自家定制的 AWS Inferentia 芯片。這意味著亞馬遜最大的推理(inferencing)服務(wù)(例如語音助手 Alexa)將交由更快、更專業(yè)的芯片進行處理,而非基于 NVIDIA 的多用途 GPU。
亞馬遜已經(jīng)將大約 80% 的 Alexa 語音助手處理遷移到 Elastic Compute Cloud (EC2) Inf1 實例上處理。和使用傳統(tǒng) GPU 的 G4 實例相比,Inf1 實例將吞吐量提高了 30%,成本下降了 45%。亞馬遜認為,它們是推斷自然語言和語音處理工作負載的最佳實例。
Alexa 的工作方式是這樣的:實際的智能音箱(或者揚聲器)可以不做任何操作,所有任務(wù)都交由 AWS 處理器完成。或者更準確的說,一旦 Echo 設(shè)備上的芯片檢測到喚醒詞,系統(tǒng)就會啟動。。它開始實時將音頻流傳輸?shù)皆啤T跀?shù)據(jù)中心的某個地方,音頻被轉(zhuǎn)換為文本(這是推理的一個示例)。然后從文本中提取含義(另一個推理實例)完成所需要的所有操作,例如獲取當天的天氣信息等等。
Alexa 完成您的請求后,她需要將答案傳達給您。然后,腳本被轉(zhuǎn)換為音頻文件(另一個推理示例),并發(fā)送到您的Echo設(shè)備。回音播放文件,以便于你出行的時候是否決定帶上雨傘。顯然,推理是工作的重要組成部分。毫不奇怪,亞馬遜投入了數(shù)百萬美元來制造完美的推理芯片。
Inferentia 芯片由四個 NeuronCore 組成。每個實現(xiàn)一個“高性能脈動陣列矩陣乘法引擎”。每個NeuronCore或多或少地由以線性,獨立方式處理數(shù)據(jù)的大量小型數(shù)據(jù)處理單元(DPU)組成。每個Inferentia芯片還具有巨大的緩存,從而提高了延遲。
責(zé)任編輯:haq
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關(guān)推薦
(億滋國際)建立戰(zhàn)略合作伙伴關(guān)系,旨在助力加強其全公司范圍內(nèi)的數(shù)字化創(chuàng)新。億滋國際選擇亞馬遜云科技作為其戰(zhàn)略云服務(wù)提供商,并已將數(shù)百個工作負載遷移至亞馬遜云科技。通過利用亞馬遜云科技行
發(fā)表于 01-21 11:36
?62次閱讀
/C++代碼快速遷移至HarmonyOS NEXT。憑借卓越的兼容性,AKI已成為廠商與開發(fā)者打造鴻蒙原生應(yīng)用過程中廣泛使用的跨語言調(diào)用解決方案。
AKI是一款專為鴻蒙原生開發(fā)設(shè)計的FFI(外部函數(shù)接口
發(fā)表于 01-02 17:08
近日,在2024年亞馬遜云科技re:Invent全球大會上,Comcast與亞馬遜云科技共同宣布了一項重大合作成果:Comcast已成功將其5G無線核心網(wǎng)絡(luò)從本地數(shù)據(jù)中心遷移至亞馬遜云
發(fā)表于 12-24 14:26
?200次閱讀
近日,亞馬遜宣布了一項重大決策,決定停止Inferentia AI芯片的開發(fā),轉(zhuǎn)而將全部精力投入到Trainium芯片的研發(fā)上,以此作為與英偉達競爭的新策略。 自2018年進軍AI芯片
發(fā)表于 12-13 14:14
?354次閱讀
亞馬遜正準備推出其最新的人工智能芯片,這標志著其在半導(dǎo)體技術(shù)方面數(shù)十億美元的投資邁出了重要一步。目標是減少對NVIDIA的依賴,后者目前在AI處理器市場占據(jù)主導(dǎo)地位。亞馬遜的云計算部門
發(fā)表于 11-15 01:08
?332次閱讀
11月1日外媒報道稱,亞馬遜已將基于人工智能技術(shù)全新打造的正版Alexa發(fā)布計劃延期至明年。
亞馬遜最初于去年9月公開了新版Alexa的規(guī)劃,意在通過集成AI大模型,顯著增強
發(fā)表于 11-01 15:19
?655次閱讀
電子發(fā)燒友網(wǎng)站提供《從TMS320DM642遷移至TMS320DM648/DM6437.pdf》資料免費下載
發(fā)表于 10-14 09:17
?0次下載
的大部分遷移至亞馬遜云科技平臺。這一舉措建立在雙方過去三年成功合作的基礎(chǔ)上,恩智浦半導(dǎo)體將借助亞馬遜云科技的高性能、可擴展性及安全可靠的云服務(wù),為汽車、物聯(lián)網(wǎng)、移動通信等多個領(lǐng)域提供更加先進的半導(dǎo)體設(shè)計解決方案。
發(fā)表于 09-30 15:28
?1086次閱讀
電子發(fā)燒友網(wǎng)站提供《如何將CCS 3.x工程遷移至最新的Code Composer Studio? (CCS).pdf》資料免費下載
發(fā)表于 09-21 09:28
?1次下載
電子發(fā)燒友網(wǎng)站提供《將軟件從8位(字節(jié))可尋址CPU遷移至C28x CPU.pdf》資料免費下載
發(fā)表于 09-06 10:42
?0次下載
IR912路由器(不帶wifi功能型號)從c.inhand.com.cn遷移至iot.inhand.com.cn平臺(備注:此方式適用于中小規(guī)模設(shè)備遷移)1.登陸c.inhand.com.cn云平臺查看
發(fā)表于 07-25 06:11
發(fā)現(xiàn)有一些設(shè)備的app,開了掃描設(shè)備后,在app的掃描列表里邊只會顯示自家的藍牙設(shè)備,而其他家的藍牙設(shè)備則不會出現(xiàn)在該列表上,求問下這個過程的實現(xiàn)原理?
(感覺是手機app這邊做了些邏輯判斷,比如
發(fā)表于 07-07 11:06
Intelligence”驅(qū)動的Siri之后,《財富》雜志的一份新報告表明,亞馬遜的Alexa——可以說是目前最有能力的語音助手——正在努力進行自己的人工智能改造: …《財富》雜志采訪的消息來源都不相信Alexa能夠完成
發(fā)表于 06-18 16:54
?1388次閱讀
亞馬遜正忙于為其廣受歡迎的Alexa智能助理進行技術(shù)升級,此次的重點在于引入更先進的人工智能生成技術(shù),旨在為用戶提供更加自然、流暢的對話體驗。據(jù)悉,這一新版本的Alexa將在今年晚些時候與公眾見面。
發(fā)表于 05-24 09:13
?634次閱讀
針對近期關(guān)于“亞馬遜云計算部門暫停訂購英偉達Hopper芯片”的報道,亞馬遜AWS部門近日給出了明確回應(yīng)。AWS發(fā)言人表示,公司并未停止任何與英偉達相關(guān)的訂單。
發(fā)表于 05-22 11:39
?602次閱讀
評論