基于深度學習的自主駕駛系統(tǒng)社會交互思考

? ? ?沒有人在真空中駕駛汽車；她/他必須與其他道路使用者協(xié)商，以實現(xiàn)他們在社交交通場景中的目標（goals）。理性的人類駕駛員可以社會兼容的方式與其他道路使用者交互，在交互密集、安全-緊要的環(huán)境中順利完成他們的駕駛?cè)蝿铡?/span>

　　本文旨在回顧現(xiàn)有的方法和理論，幫助理解和重新思考人類駕駛員之間的交互，從而實現(xiàn)社會自主駕駛。這項綜述為了尋求一系列基本問題的答案：

　　1）什么是道路交通場景中的社會交互？2）如何衡量和評估社會交互？3）如何建模和揭示社會交互過程？4）人類駕駛員如何在社會交互中達成隱性協(xié)議并順利協(xié)商？

　　本文回顧了建模和學習人類駕駛員之間社會交互的各種方法，從優(yōu)化理論和圖模型（graphical models）到社會力理論和行為認知科學。還強調(diào)了一些新的方向、關鍵挑戰(zhàn)以及未來研究的開放性問題。

　　人類可以被訓練成具有強大社會交互能力的卓越駕駛員。在現(xiàn)實世界的交通中，理性的人類駕駛員可以通過使用非語言通信（如手勢，向另一輛車揮手讓路）、指示語（如使用轉(zhuǎn)向信號燈指示意圖）等有效地與周圍環(huán)境協(xié)商，在復雜和擁擠的場景中做出與社會兼容的決策，以及運動線索（例如加速/減速/轉(zhuǎn)彎）。

　　理解復雜交通場景中人類駕駛員之間動態(tài)交互的原則和規(guī)則，可以 1）利用對他人行為或反應的信念和期望，產(chǎn)生不同的社會駕駛行為；2）預測具有移動目標場景的未來狀態(tài)，對于構(gòu)建可能安全的智能車輛至關重要，其具有行為預測和潛在碰撞檢測的能力；3）創(chuàng)建逼真的駕駛模擬器。

　　然而，這項任務不簡單，因為從交通心理學家的角度來看，在駕駛交互過程中存在各種社會因素，包括社會動機、社會感知和社會控制。一般來說，人類駕駛行為由人類駕駛員的社會交互和與場景的物理交互所構(gòu)成。

　　由于人類之間的連續(xù)閉環(huán)反饋，社會交互比物理交互更加復雜，并且存在許多不確定性。社會交互可能只需要簡單的決策，直接將人類感知映射到行動，而無需具體的推理和規(guī)劃（例如，刺激反應、反應性交互、跟車）。社會交互也可能需要復雜的決策，通過預測其他智體的行為并評估所有可能替代方案的影響，迫使人類駕駛員謹慎地決定備選方案中的行動（例如，讓路或通過）。

　　另一方面，人類駕駛員可以通過顯式通信相互交流，例如使用手勢和閃光燈。然而，在實踐中，明確的溝通選項并不總是可用或最有效。在許多情況下，人類駕駛員更喜歡使用隱式而非顯式通信來完成交互交通場景中的駕駛?cè)蝿铡?/p>

　　從人與人之間交互到人與自動駕駛汽車（AV）的交互

　　人與人之間的社會交互。人類是自然的社會傳播者；人類駕駛員安全高效地與其他智體進行協(xié)商，形成一個交互密集的多智體系統(tǒng)。一般來說，人類駕駛行為受兩類規(guī)范的支配：法律規(guī)范和社會規(guī)范。

　　交通規(guī)則構(gòu)成法律規(guī)范，人類社會因素構(gòu)成社會規(guī)范。在真實的交通中，人類駕駛員并不總是嚴格和刻板地遵守交通法規(guī)（例如，在高速公路上保持在限速之下），這是合規(guī)的行為（即法律規(guī)范）。

　　相反，人類駕駛員通常會根據(jù)隱含的社會規(guī)范和規(guī)則駕駛，促進道路高效和安全的行為。現(xiàn)有研究還表明，根據(jù)隨便的行為（即社會規(guī)范）行事，可以使其他人的行為變得可識別和可預測，從而減少交互不確定性，促進每個智體的決策。

　　因此，通過純粹的法律規(guī)范理解和推斷其他人的駕駛行為可能是無效的，因為：

　　交通規(guī)則并不總是規(guī)定駕駛行為。例如，當駕駛員打算在擁擠的交通中改變車道時，交通法只禁止碰撞，但沒有具體說明駕駛員應如何與他人合作或競爭以形成空檔。社會規(guī)范通常主導這種交互行為。

　　人工駕駛不嚴格遵守交通規(guī)則。如圖說明了現(xiàn)實生活中經(jīng)常發(fā)生的交互場景。一名經(jīng)驗豐富的駕駛員（紅色）打算通過十字路口，但其領路車正在等待左轉(zhuǎn)。駕駛員可以越過白色實線并從右側(cè)通過超車，節(jié)省行駛時間。雖然這種行為稍微違反了交通規(guī)則，但卻提高了交通流效率。

　　因此，讓自動駕駛汽車（AV）配備人與人之間交互的集體動力學，可以在人類環(huán)境中做出知情和社會兼容的決策。

　　自動駕駛車輛的社會行為。作為移動智能的智體，智能車輛也需要與人類交互，并將成為復雜社會系統(tǒng)的一部分。在這樣一個安全-緊要的系統(tǒng)中，AVs應該無縫地融入到有人類駕駛的道路中，并在社交上與達到人類水平的性能兼容。然而，如圖所示，人類駕駛員遵循的規(guī)范與自動駕駛車輛之間存在很大差距。

　　嚴格遵循法律規(guī)范的自動駕駛車輛可能無法應對高度交互的場景，并搞糊涂其他遵循社會規(guī)范的人類駕駛員。例如，在停車標志（可被視為法律規(guī)范）向人類傳遞令人困惑的社會線索之前，AV嚴格且刻板地遵循3秒法則：“為什么車輛不前進？”為了有效溝通，AVs需要模仿或理想地改進，如人類一般駕駛，這要求他們：

　　理解并適應他人的社交和運動線索。這將AV視為信息接收器，使其在功能上安全高效。例如，如果沒有認識到其他駕駛員的攻擊性水平，將使AV不安全或過于保守。

　　提供可識別、信息豐富的社交和動作線索。AVs視為信息發(fā)送者，其他人類駕駛員能夠感知和理解AVs行為，從而能夠進行安全有效的工作。例如，在讓行和通過之間猶豫的AV會搞糊涂其他道路使用者，導致事故或交通堵塞。

　　并不是說AVs為了表現(xiàn)得像人類駕駛員或與社會兼容就要違反交通規(guī)則。學習和理解人類駕駛員遵循的社會規(guī)范有助于高效安全的交互。

　　如圖說明了兩個智體（人類駕駛員和/或AV）之間的動態(tài)通信過程，每個智體在信息交換過程中扮演兩個角色：信息發(fā)送者和接收者。例如，智體A將充當信息發(fā)送者，“告訴”智體B其意圖。同時，智體B應該感知并理解智體A提供的信息（即感知），然后通過提供可識別的有用信息采取一些行動來響應或適應智體A。

　　賦予AVs人類社會能力，提高復雜交通場景中的交互性能。例如，用計算認知模型對人類社會偏好（如利他、親社會、利己和競爭）以及與AV交互時的合作水平進行定量評估。

　　在量化社會交互之前，我們首先需要弄清楚在特定場景中 “交互何時發(fā)生？”或者“是否人類駕駛員之間發(fā)生交互？”。一個相關的問題是 “誰參與了交互？”

　　在實際交通中，道路使用者并不總是有豐富的交互。例如，在人行道上移動的單個行人通常不會影響其他行人，但更豐富社會交互模式的任務除外，例如體育。同樣，駕駛員之間豐富的社會交互可能并不總是發(fā)生。

　　人類駕駛員主要單獨駕駛，并對物理環(huán)境做出反應，但在大多數(shù)駕駛?cè)蝿罩校绺咚俟返能嚨辣３中袨楹统鞘行盘柦徊媛房诘氖鼙Ｗo左轉(zhuǎn)行為，不會與其他道路使用者直接交互。有三種常用的方法來確定何時發(fā)生交互以及誰參與交互。

　　潛在沖突檢查

　　確定一個駕駛員是否會與另一個駕駛員（直接或間接）交互的一種直接方法是檢查他們近期的路徑是否沖突。如果路徑?jīng)_突，則會發(fā)生交互，否則不會發(fā)生交互。該檢查方法即沖突點的定義，“靠近車輛路徑合并、分流或交叉區(qū)域的位置。”

　　假設只有潛在沖突的車輛才能相互交互，簡化了交互場景，這與日常駕駛過程中的人類直覺一致。可以從多個移動目標的預測未來運動和意圖來評估潛在沖突。

　　駕駛員可以利用道路幾何和交通法規(guī)的相關信息來檢查與他人的潛在沖突。當駕駛員進入交通規(guī)則明確的交叉路口時，可以通過檢查與其他虛擬參考線的交叉點來識別沖突點。此外，駕駛員還用指示語及其對他人意圖和動作的社會推理來識別潛在沖突點。例如，當駕駛員（表示為A）注意到相鄰車輛（表示為B）打著閃光燈（即指示燈）或有意接近，目的是切入駕駛員A的前方間隙（即社會推理）時，駕駛員A可以識別駕駛員B的換道意圖，接著發(fā)生沖突。

　　感興趣區(qū)域設置

　　確定交互何時發(fā)生的另一種方法是在環(huán)境中設置特定的感興趣區(qū)域（RoI）。同時占據(jù)RoI的任意一對智體之間存在交互，并且一旦任何一個智體移動到RoI之外，交互就會消失。設置RoI通常是面向應用的，可以根據(jù)以下兩種方法進行設計：

　　以場景為中心。確定地圖上的RoI，并將該地區(qū)的所有人類駕駛員視為交互智體。該方法通常用于預測和分析特定交通區(qū)域（如城市交叉口和環(huán)島）中的多智體駕駛行為。在這些情況下，研究人員在地圖上確定了涵蓋此類場景的RoI，并假設占據(jù)RoI的所有駕駛員都會相互影響。

　　以智體為中心。將RoI與一個感興趣的智體（即自智體）連接起來。這種方法通常用于研究自智體與其周圍智體的交互行為，例如高速公路上的車道變換行為。RoI的形狀有多種選擇。例如，在研究高速公路上的車道變換交互行為時，通常將矩形區(qū)域連接到自車并設置為RoI。

　　請注意，有些方法還混合二者。例如，在設定高速公路路段的RoI后，進一步計算了智體之間的距離，以確定交互的存在。

　　上述RoI需要手工制定的規(guī)則，相關的評估性能可能對RoI的配置敏感。一般來說，RoI越大，參與的智體越多，可能會高估交互；而RoI小，參與的智體越少，可能會低估交互。為了克服這些缺點，可以根據(jù)駕駛?cè)蝿罩鲃舆x擇交互智體。

　　面向任務的智體選擇

　　人類將根據(jù)具體的駕駛?cè)蝿眨羞x擇地確定應該更多關注哪些智體以及何時應該關注。受這一事實的啟發(fā)，研究人員根據(jù)問題及其相應交互過程的領域知識，根據(jù)經(jīng)驗為特定任務選擇交互智體。例如，對于左車道變換任務，研究人員假設自車僅與當前車道上的領頭車輛以及左目標車道上的領頭和跟隨車輛交互。該假設符合人類駕駛經(jīng)驗，并且可以通過只關注任務相關的智體來簡化交互問題。然而，它需要具有特定領域知識的手工規(guī)則，并且可能無法捕捉個體在如何關注方面的差異。

　　檢查駕駛員對彼此的影響可以確定是否存在人類交互。對于駕駛員之間的交互，一項關鍵任務是弄清楚 “如何在利用社會因素的同時量化這些交互？” 常用的量化方法，通常可分為兩類：基于顯式模型的方法和隱式數(shù)據(jù)驅(qū)動的方法。

　　基于模型的方法

　　最常用的顯式量化交互的方法是構(gòu)建交互模型，其中一些參數(shù)可以從傳感器數(shù)據(jù)中估計，以量化智體之間的社會交互強度。研究人員利用基于不同假設的傳感器信息開發(fā)了許多交互模型，如圖所示四類。

　　對于作為模型輸入的傳感器數(shù)據(jù)，設計師可以明確解釋與物理距離相關的度量，從而獲得更多研究人員的吸引。在應用中，可以直觀地假設交互強度與交通場景中智體相對距離及其變量（例如，相對速度和加速度）相關。例如，相距較近的駕駛員在直覺上會視為彼此具有較大的交互影響。

　　1 基于理性效用的模型

　　人類駕駛行為或動作是（接近）最佳結(jié)果，可最大化環(huán)境的某些效用。在這一點上，研究人員將物理距離相關信息整合到目標/成本函數(shù)中，將駕駛員之間的相互作用表述為優(yōu)化問題，這可以用現(xiàn)成的動態(tài)和線性規(guī)劃算法來解決。通常，成本函數(shù)是根據(jù)交通管制和駕駛?cè)蝿盏南闰炗蛑R手工構(gòu)建的。例如，研究人員將駕駛員的換道機動視為一個優(yōu)化問題，即在車輛動力學約束下最小化橫向路徑跟蹤誤差（橫向控制），同時保持期望速度（縱向控制）。通常，基于效用的模型可以在類似場景中仔細調(diào)參達到預期性能，但在未知場景中通用性較低。通常使用的模型是最優(yōu)群（optimal swarms）、博弈論模型、模仿學習和馬爾可夫決策過程（MDP）。

　　2 概率生成模型

　　社會交互情境的描述是一種條件，其中單個駕駛員的行為由其組織特征和環(huán)境決定，其他駕駛員的行為是環(huán)境的一個組成部分，反之亦然。從條件概率角度來看，駕駛員之間的交互影響可以解釋為“在感知到周圍其他駕駛員的狀態(tài)后，一個駕駛員可能怎樣采取特定的行動？”。該問題可以通過概率條件分布或條件行為預測來表示。

　　這一概念是貝葉斯網(wǎng)絡的基礎。此外，可以通過一種意外的交互來量化智體的交互作用。在這種交互作用中，一個智體（表示為智體B），由于另一個智體（表示為智體A）觀察到的軌跡，而經(jīng)歷行為的變化。這種想法使得信息論中的大多數(shù)現(xiàn)成相似性度量方法（如KL發(fā)散）變得容易。

　　另一方面，交互作用也可以進一步視為（潛在的）概率生成過程或條件概率模型。例如，一種概率圖模型捕捉領頭車輛的未來狀態(tài)與動態(tài)系統(tǒng)（即領頭車輛和后隨車輛）歷史狀態(tài)之間的相互作用。然而，它沒有考慮并入車輛對前后車輛之間相互作用的影響。一種交互-覺察概率駕駛員模型，捕捉駕駛員的交互偏好，并且考慮到周圍駕駛員行為的預測，駕駛員將在當前時間步執(zhí)行機動。然后，在逆優(yōu)化框架下，通過加權特征（即導航和風險特征）的組合來制定交互偏好。

　　3 潛在/風險域

　　基于人類駕駛行為來自基于風險域的假設，提出潛在/風險域的模型。在人類機器人和多車輛交互，已經(jīng)廣泛研究了勢函數(shù)對智體之間交互進行建模。物理距離相關度量通過某些可學習可解釋的函數(shù)（稱為潛函數(shù)）允許有效地制定交互，這些函數(shù)可以嵌入交通規(guī)則和駕駛場景上下文的領域知識。

　　另一方面，勢函數(shù)相對坐標系（例如，x和y方向）的導數(shù)，導致“推”或“拉”車輛的尺度化虛擬力，最小化車輛的局部規(guī)劃成本，同時與周圍的駕駛員進行交互。研究人員還設計了能量函數(shù)，根據(jù)周圍車輛和自車之間的相對距離（通常是兩條車輛軌跡的最小值或最近點）捕捉車輛間的交互作用。

　　然而，基于相對距離的測量并不總是正確地捕捉駕駛員之間的交互。當智體之間存在物理約束時，距離較近的駕駛員可能非常弱或無交互作用，例如高速公路護欄或?qū)γ孳嚨赖姆指艟€。

　　4 認知模型

　　研究人員用相對距離來表征駕駛員風格，并揭示多智體之間的交互過程，例如，心理學理論和信息累積測度。從行為科學和心理學角度出發(fā)，還開發(fā)了其他類型的交互模型來模擬人類的駕駛行為。

　　數(shù)據(jù)驅(qū)動的方法

　　與上述模型不同，該模型直接利用顯式傳感器信息來表征人類駕駛員之間的交互，另一種方法使用編碼的隱式信息來量化交互。此類隱式信息通常以低維標量或向量的形式出現(xiàn)（在圖模型中也稱為嵌入），分為三種編碼交互的方法。

　　1 深度神經(jīng)網(wǎng)絡

　　神經(jīng)網(wǎng)絡表示通過一系列基本層（例如，卷積和遞歸）將多個傳感器信息映射到低維向量特征，例如，在自動編碼器和生成對抗網(wǎng)絡（GAN）結(jié)構(gòu)中。此外，注意機制還可以集成到網(wǎng)絡中，模擬駕駛員之間的交互。

　　2 具有社會池化的圖神經(jīng)網(wǎng)絡

　　圖神經(jīng)網(wǎng)絡（GNN）與常規(guī)深度學習（嵌入結(jié)構(gòu)信息作為模型輸入的多層神經(jīng)網(wǎng)絡）有一些共同點。信息池化是一種靈活的工具，可根據(jù)深度神經(jīng)網(wǎng)絡和大量編程開源的優(yōu)勢，將時域空間和空域空間的智體之間關系抽象為低維可量化嵌入（例如，歸一化連續(xù)向量）。嵌入可以是時域相關的，捕獲演化圖（evolving graph）中節(jié)點和邊緣的時間信息。

　　因此，它們可以通過聚合操作來表征人類駕駛員之間的交互強度，例如平均聚合、加權聚合和圖演化消息（或圖消息傳遞）。此外，池化操作可以獨立或同時用不同的神經(jīng)網(wǎng)絡結(jié)構(gòu)將信息嵌入到時域和空域維度上的低維潛狀態(tài)中。前者通常首先應用時域模型（例如，LSTM）來獨立概括每個駕駛員隨時間變化的特征，然后用一個社會模型制定概括特征的交互，如convolutional social pooling。

　　能夠模擬車輛交互的編碼嵌入可以通過訓練GAN和自動編碼器獲得。盡管一些方法在標準基準測試中顯示了有希望的結(jié)果，但仍不清楚這些方法應該用什么信息來預測未來狀態(tài)，以及如何用物理意義解釋這些嵌入。量化交互關系的另一種方法，是在序列觀測下采用某些圖邊緣的可學習權重，也稱為加權圖邊緣。這些“編碼器”的一個顯著特征是，它們很少或根本沒有提及學習的編碼信息的有效性和可解釋性。

　　3 拓撲模型

　　編碼駕駛員之間交互的另一個想法是使用拓撲編織（topological braids）的形式將其映射為二重代數(shù)和幾何性質(zhì)的緊湊表示。這種緊湊的拓撲表示有助于理解任何環(huán)境中與任何數(shù)量駕駛員的復雜交互行為。

　　對社會駕駛過程中的影響建模

　　交通場景中的顯式傳感器信息和其他駕駛員行為中的隱式社會推斷，使人類可以非常好地駕駛，從而進行安全的和社會可接受的操縱。人類的天性是，以社會偏好、社會模仿和社會推理等因素，賦予信息吸收和行為預期能力，這是社會兼容駕駛行為的核心。

　　對這些社會因素的定量評估需要計算認知科學和技術。

　　1 駕駛偏好的社會價值取向（SVO，Social Value Orientation）

　　人類駕駛員在與他人交互時會有各種社會偏好。社會偏好，如其他人類駕駛車輛的利他傾向，可以從計算心理學（如SVO）進行定量評估。SVO模型衡量了一個駕駛員如何將其獎勵相對其他智體的獎勵的加權，這可以從逆強化學習（IRL）結(jié)構(gòu)下的觀測軌跡中學習。然后，SVO模型的在線學習駕駛偏好，集成到兩輛或多輛的車輛協(xié)同交互的游戲場景中。SVO概念已被廣泛研究并應用于社會兼容的自主駕駛中。

　　2 社交驅(qū)動模仿的社會凝聚力

　　”人類駕駛員像綿羊一樣相互跟隨‘，共同作用對交通行為的影響非常強烈。因此，人類駕駛車輛的行為具有社會凝聚力——駕駛員會采取與周圍駕駛員類似的行動。例如，如果領頭車輛減速并采取輕微的“避碰”行為，自車駕駛員通常會采取類似的行動，在社交上假設可能存在虛擬障礙物（例如，圓錐體、動物身體、路面坑）。受人類駕駛員司社會凝聚力的啟發(fā)，有人開發(fā)了一種凝聚增強的獎勵函數(shù)，確定哪些方面（what aspects）、誰（who）、和何時（when）跟隨以保證安全，自動跟隨其他車輛。

　　3 現(xiàn)場-覺察的社會感知

　　人類可以主動收集并獲取有關環(huán)境的附加信息，創(chuàng)建相對完整的交通場景，從而提供足夠的信息并提高環(huán)境意識，從而進行安全高效的機動。例如，通過感知相鄰車輛的減速和停車行為，無論駕駛員的視線是否被遮擋，人類駕駛員可以推斷出潛在的行人通過道路。人類將其他駕駛員視為傳感器的能力已被設計并集成到自動駕駛車輛中，增強駕駛員的現(xiàn)場-覺察。

　　4 駕駛風格的社會交互風格

　　人類駕駛員通過評估和平衡未來不同的獎勵條款來制定規(guī)劃并采取行動。根據(jù)其內(nèi)部模型、駕駛?cè)蝿蘸蛣訖C，人類可能會格外關注不同的獎勵條件，通過這些條件，人類與周圍環(huán)境之間表現(xiàn)出不同的交互風格，如攻擊性、保守性、禮貌性、自私性和非理性。因此，交互樣式可以表示為在生成軌跡時不同特征的加權結(jié)果。例如，研究人員定量衡量這些社會因素誘發(fā)的交互風格作為獎勵特征。然后，用逆強化學習（IRL）從軌跡中學習此類特征的權重或排名目標函數(shù)。

　　如圖是人類駕駛員之間交互建模和學習的方法概述：包括基于理性效用的模型、基于深度神經(jīng)網(wǎng)絡的模型、基于圖模型、社會場和社會力以及計算認知模型。

　　基于理性效用的模型

　　日常交通中最常見的交互場景是城市環(huán)境和高速公路中的跟車、匯入/匯出和換道。研究人員將人類駕駛員視為最優(yōu)控制器，其具有可訪問的目標函數(shù)，實現(xiàn)預定義的目標導向（goal-oriented）任務，制定這些場景中的行為。

　　例如，當在公路閘道上匯合時，將整個過程視為一個顯式動態(tài)系統(tǒng)，可以將公路上后方車輛對前方車輛的縱向行為（如加速/減速）表示為一個最優(yōu)控制器。然而，自然交通場景中駕駛員或其他人之間的交互具有物理（例如，運動學和幾何）和社會（例如，意圖、注意和責任）約束。

　　通常，基于優(yōu)化的方法需要特定的目標（例如，車輛之間的期望間隙和車頭前進速度）和待優(yōu)化的目標函數(shù)。

　　本文沒有列舉所有基于優(yōu)化的方法，但選擇了一些流行的方法，包括基于swarm/flocking的模型、博弈論模型、模仿學習和馬爾可夫決策過程（MDP）。

　　基于swarms/flocks的方法

　　值得注意的是，在應用中Reynolds規(guī)則的大多數(shù)具體實例是基于牛頓運動定律傳播的動態(tài)模型。因此，這需要開發(fā)一套反映Reynolds定律的力分量全集，這些力分量（即內(nèi)聚、分離和對齊）與用于模擬行人交互的社會力理論各部分完全匹配。

　　Reynolds規(guī)則揭示了交互的基本機制，比基于社會力的理論更具普遍性。

　　盡管flocking啟發(fā)的規(guī)則成功地揭示了動物（如鳥類、魚類和羊群）之間的群體（swarm）交互機制，但它們只能在自由空間或有靜態(tài)障礙物的空間（如天空中的鳥類和海洋中的魚類）中很好地工作。

　　在交互式交通場景中，這些規(guī)則可能由于兩種類型約束而失效。

　　（i）交通環(huán)境的限制。flocks運動的空間有微弱的物理限制，甚至沒有物理限制，例如在開闊的天空和水下。相反，道路車輛的運動空間具有來自道路輪廓和交通基礎設施的許多約束。例如，車輛應在車道內(nèi)行駛，而不是在道路邊界內(nèi)行駛。

　　（ii）智體本身的約束。行人和flocks具有高度的運動，例如行人可以在不改變位置的情況下轉(zhuǎn)身。然而，人類駕駛員操作的車輛具有物理運動約束，例如車輛結(jié)構(gòu)導致的最大轉(zhuǎn)彎角和最小轉(zhuǎn)彎半徑。

　　總之，在真實道路交通中，采用flocks啟發(fā)的方法去捕捉人類駕駛員交互會帶來一些挑戰(zhàn)：

　　1.交通規(guī)則：交通場景是結(jié)構(gòu)性的，因為交通標志和燈控制交通。人類駕駛員應該遵守許多交通規(guī)范和規(guī)則，以確保安全和效率，例如保持車輛在車道上。

　　2.個體異質(zhì)性：并非每個人類駕駛員都會嚴格遵守Reynolds規(guī)則的每一項；相反，人類駕駛員可能會根據(jù)他們的駕駛?cè)蝿照{(diào)整規(guī)則。例如，人類駕駛員的期望狀態(tài)可能因其駕駛風格而不同。此外，人類行為可能是隨機和時變的。因此，因為道路使用者的個體異質(zhì)性，很難完美地標定模型匹配所有個體的觀測值。

　　博弈方法

　　大多數(shù)最早的駕駛員交互博弈論模型關注矩陣博弈。目前，大多數(shù)人將交互行為轉(zhuǎn)化為迭代優(yōu)化問題，角色分配將影響模型性能。因此，動態(tài)博弈所需的第一個問題是“自車應如何在連續(xù)博弈的單個階段考慮其他駕駛員的影響和角色？”通常，這個問題有三種解決方案，如圖所示，將人類駕駛員視為（a）障礙，（b）理性追隨者，以及（c）相互依賴的參與者。

　　博弈論框架提供了一個可解釋的顯式解決方案來模擬人類駕駛員之間的動態(tài)交互。然而，盡管簡化系統(tǒng)動力學和信息結(jié)構(gòu)方面取得了一些進展，但仍難以滿足其在連續(xù)狀態(tài)-動作空間中計算易處理的實時約束。由于這些限制，大多數(shù)當前的博弈論交互建模方法都存在可擴展性問題，因此僅限于兩個車輛的設置和模擬實驗，或只是成對地處理多智體場景。

　　社會偏好是一種方法，將重復博弈的長期影響補償為單步博弈的獎勵。社會價值反映了智體在交互中的經(jīng)驗，可嵌入智體的效用（RL領域稱為獎勵，或控制理論領域稱為成本函數(shù)）。

　　人類是有適應性的，通過與環(huán)境安全交互的獎勵-強化機制學習駕駛。受此啟發(fā)，學習與其他駕駛員交互的過程，可以通過博弈論的強化學習來制定。除自車之外的智體可視為環(huán)境的一部分，會產(chǎn)生兩種交互建模的博弈方案。如圖所示：分為異步和同步。

　　?異步方案。每個駕駛員將其他周圍駕駛員視為環(huán)境的一部分，如圖（a）所示。異步方案下人類駕駛員之間的交互動力學可以用特定的博弈論方案實現(xiàn)，如k-級博弈，其中人類駕駛員的行為以迭代方式預測，如圖（c），而不是同時評估。具體來說，為了獲得一個k-級智體的策略，所有其他智體的策略都設置為（k-1）-級，這有效地成為動態(tài)已知環(huán)境的一部分。因此，k-級智體的策略估計是對其他（k-1）級智體操作的最佳響應，如圖（b）所示。

　　?同步方案。在多駕駛員交互場景中，每個人類駕駛員都試圖通過類似試錯的過程同時解決順序決策問題。環(huán)境狀態(tài)的演變和每個人類駕駛員收到的獎勵函數(shù)，是由所有駕駛員的聯(lián)合行動決定。因此，人類駕駛員需要考慮環(huán)境和其他人類駕駛員并與其交互。為此，同步方案可以通過馬爾可夫博弈，也被稱為隨機博弈，捕獲涉及多個人類駕駛員的決策過程。每個智體表示為基于MDP的智體，形成多智體強化學習（MARL）。

　　MARL算法的不同學習范式可以設計為不同交互任務的特定假設。從理論上講，學習范式可分為六組，如圖所示：（a）共享策略、（b）獨立策略和（c）組內(nèi)共享策略。（d）一旦中央控制器控制所有駕駛員。（e）集中訓練和分散執(zhí)行：在訓練期間，駕駛員可以隨時與任何其他駕駛員交換信息；在執(zhí)行過程中，駕駛員獨立操作。（f）聯(lián)網(wǎng)駕駛員進行分散訓練：在訓練期間，駕駛員可以與網(wǎng)絡中的鄰居交換信息；在執(zhí)行過程中，駕駛員獨立操作。

　　單智體的MDP

　　另一個建模自車如何學習與他人交互的流水線是單智體MDPs方案。單智體MDP假設包含其他智體的環(huán)境是靜止的，因此可以通過馬爾可夫決策過程（MDP）來表示。自車在與環(huán)境交互時，動態(tài)展開交互軌跡，在考慮其行為影響的情況下，嘗試選擇最佳規(guī)劃，最大化相關獎勵。

　　從人類演示學習駕駛

　　以上討論的群優(yōu)化和博弈論方法都是前向設計。通過啟發(fā)式設置超參來解決優(yōu)化問題，而不是使用數(shù)據(jù)進行優(yōu)化。利用認知領悟分析場景，然后設計一個先驗已知的相關成本/目標函數(shù)，模擬人類駕駛員之間的交互行為。

　　駕駛員之間社會交互背后的決策和運動，潛在機制是復雜的，難以編碼為簡單的手工編程規(guī)則。一般來說，演示交互行為要比指定生成相同行為的獎勵函數(shù)容易得多。這一事實為模擬和學習人類駕駛員的交互提供了另一種選擇：通過模仿學習直接從人類演示中學習交互行為。

　　基于所學（行為軌跡或效用），有兩種方法：（i）行為克隆，其直接學習從觀測（例如，圖像）到動作（例如，轉(zhuǎn)向角和油門踏板）的映射；或（ii）效用恢復，它間接地使用數(shù)據(jù)來檢索獎勵函數(shù)，計劃的交互行為盡可能地模仿演示。

　　行為克隆是模仿學習的最簡單形式，它專注于監(jiān)督學習去復制智體的策略。其主要優(yōu)點是簡單和高效。行為克隆旨在解決回歸問題，其中通過最大化目標函數(shù)（例如，在訓練數(shù)據(jù)中采取行動的可能性）或最小化損失（例如，模擬數(shù)據(jù)和真實數(shù)據(jù)之間的行為推導）來實現(xiàn)優(yōu)化。

　　行為克隆在為簡單的駕駛行為（如車道跟蹤和高速公路上的汽車跟隨）制定駕駛政策方面表現(xiàn)出了效率。行為克隆的成功依賴于能夠充分覆蓋訓練和測試數(shù)據(jù)集的狀態(tài)和活動空間的足夠數(shù)據(jù)。然而，行為克隆并沒有利用訓練過程中的級聯(lián)學習（cascaded learning）錯誤。假設數(shù)據(jù)獨立且相同分布（i.i.d.），測試過程中將出現(xiàn)級聯(lián)誤差。因此，行為克隆學習的模型在復雜的交互場景中通常表現(xiàn)不佳。

　　行為克隆旨在通過回歸技術直接復制專家的行為或軌跡。相反，IRL方法依賴于從觀察的交互行為/軌跡中檢索成本函數(shù)，前提是獎勵函數(shù)在不同交通場景中最簡潔、穩(wěn)健和可轉(zhuǎn)移。這一假設與一個事實相吻合，即人類駕駛員可以從未見過的場景中與其他智體高效、安全地交互。

　　恢復智體之間的交互過程通常假設環(huán)境狀態(tài)本質(zhì)上具有馬爾可夫?qū)傩裕鋵W習任務模擬為馬爾可夫決策過程（MDP）。因此，人類駕駛員的交互過程通過參數(shù)化模型來描述，該模型參數(shù)可以通過優(yōu)化設計的目標函數(shù)來估計。直接的方法是使用標準MDP，其中其他人類駕駛員被視為環(huán)境的一部分。

　　在現(xiàn)實交通中，人類駕駛員的感知能力有限，無法準確感知所需信息；因此，可以使用部分可觀察的MDP（POMDP）對交互進行建模。在MDP結(jié)構(gòu)下，人類駕駛員的交互決策和控制被視為當前交通場景的最佳解決方案，通考慮短期內(nèi)可能的結(jié)果，最大化其回報（或最小化其成本）。這種假設允許逆最優(yōu)控制（IOC）或IRL學習人類駕駛員的交互過程。

　　請注意，IRL在模仿學習和博弈論模型中用作檢索獎勵的函數(shù)，但發(fā)揮不同的作用。在模仿學習中，IRL旨在學習自車智體的獎勵函數(shù)，模仿自車智體的駕駛行為。在博弈論模型中，IRL用于學習作為自車智體輸入的其他智體獎勵函數(shù)。

　　基于深度神經(jīng)網(wǎng)絡的方法

　　主要關注車輛狀態(tài)（例如，位置、速度、加速度和航向角）作為輸入的方法，同時考慮以下兩個方面。首先，直接處理原始傳感器數(shù)據(jù)的深度學習方法（例如，攝像機RGB圖像和3D激光雷達點云的卷積），通常遵循純端到端學習過程，導致弱和隱式交互推理。此外，這些工作的中心焦點通常不在于交互建模。第二，大多數(shù)現(xiàn)有的高質(zhì)量自主駕駛運動數(shù)據(jù)集16可以提供足夠和精確的代理狀態(tài)軌跡信息。

　　交互編碼

　　深度學習是一種強大的工具，具有良好的多智體交互建模潛力。如今，神經(jīng)網(wǎng)絡可能非常復雜。例如，用于自然語言處理（NLP）任務的大型模型GPT-3在其完整版本中有1750億個模型參數(shù)。

　　然而，基本上有四種類型的基本神經(jīng)網(wǎng)絡構(gòu)建塊（全連接層、卷積層、遞歸層和圖層），可以為特定應用開發(fā)復雜的網(wǎng)絡。不同的構(gòu)建塊在數(shù)據(jù)和解決方案空間上造成不同的歸納偏差。人們選擇不同的構(gòu)建塊將不同的歸納偏差注入學習過程獲得更好的性能，而不匹配的歸納偏差可能反過來導致次優(yōu)或較差的性能。

　　對于許多深度學習實踐者來說，這些模塊可能已經(jīng)是現(xiàn)成的，并且正在開發(fā)每個層更復雜的變型和操作。

　　社會交互的特征表征

　　時空狀態(tài)特征張量、空間占用網(wǎng)格和動態(tài)插入?yún)^(qū)域是與深度學習模型交互建模常用的三種特征表示。

　　1）狀態(tài)特征列表

　　假設N個智體對交通場景感興趣，并且其狀態(tài)特征是可測量的。將時間步t第i個智體的狀態(tài)特征表示為垂直向量x（i），如圖所示。

　　這種表示是有效的，是表示交互場景所需的最小信息量。然而，它有兩個局限性。首先，特征大小、車輛數(shù)量和每個車輛的有效時間步長T可能隨時間和空間變化，這對于期望恒定大小輸入的學習方法是有問題的。其次，這種類型的特征表示是置換可變的，即取決于交互智體列出的順序。例如，簡單地切換智體i和智體j的特征條目將導致不同的特征表示。避免這些限制的常用方法是使用占用網(wǎng)格圖如下。

　　2）占用網(wǎng)格圖

　　占用網(wǎng)格圖定義了自車周圍（即以自車為中心）或特定固定區(qū)域（即以場景為中心）中的空間網(wǎng)格。占用網(wǎng)格圖可以處理感興趣區(qū)域（RoI）中不同數(shù)量的智體。占用網(wǎng)格圖可以通過填充原始狀態(tài)（例如，位置、速度、加速度）或編碼狀態(tài)（例如由全連接層輸出的隱藏狀態(tài)）來表示交互場景。智體之間的空間關系自然地在網(wǎng)格圖布局中捕獲。此外，如圖所示，如果網(wǎng)格h（i，j）（由色條表示）由隱藏特征填充，這些隱藏特征的編碼獨立于每個車輛的τ時間步長歷史軌跡：

　　請注意，網(wǎng)格圖的形狀取決于場景。例如，網(wǎng)格圖可以是公路交互的矩形網(wǎng)格或環(huán)形交叉口的對數(shù)極坐標網(wǎng)格。空間網(wǎng)格表示是光柵大小和智體順序不變的，但反過來，由于張量的大小與覆蓋面積大小和網(wǎng)格分辨率相關，因此會受到精度-大小權衡的影響。

　　3）交互圖

　　另一種表示將駕駛場景中的實體表示為圖節(jié)點vi，并將實體之間的關系表示為圖邊緣ei。時間范圍T中的所有節(jié)點和邊緣，然后構(gòu)造時空交互圖G，該圖允許顯式交互和關系推理。

　　有兩種類型圖，在實體/節(jié)點的定義上有所不同。第一種是基于智體的圖，它將場景中的智體表示為節(jié)點。智體指道路參與者，如車輛、行人、摩托車。每個節(jié)點由每個智體的狀態(tài)特征或編碼特征表示。

　　基于智體的圖集中于表示智體，而另一個稱為基于區(qū)域的圖集中表示車輛的意圖。許多方法根據(jù)機動級別對駕駛意圖分類，如車道保持、車道變換和轉(zhuǎn)彎。然而，這些操作在駕駛場景中受到高度限制。例如，由于不同的道路拓撲結(jié)構(gòu)，在高速公路或環(huán)島上的機動可能會非常不同。

　　為了使自動駕駛車輛在現(xiàn)實生活中經(jīng)過動態(tài)交互交通場景，需要對駕駛意圖進行統(tǒng)一和通用的定義。為此，一個有希望的表示是動態(tài)插入?yún)^(qū)域（DIA），即車輛可以插入的駕駛場景可用間隙。如圖所示，當從場景中提取DIA時，靜態(tài)元素（道路拓撲，如Frenet幀坐標、道路標記，如停車標志）和動態(tài)元素（如場景中的移動車輛）都會被利用。因此，DIA可以作為動態(tài)環(huán)境的統(tǒng)一表示，涵蓋所有道路設置上所有類型的駕駛意圖和交互。在形式上，時間步t的第i個DIA定義為Ati =（Xfront，Xrear，Xref），包括DIA所在的前邊界Xfront、后邊界Xrear和參考路徑Xref的信息。前邊界和后邊界由車輛或道路標記形成。然后，時間范圍T中的所有DIA可以構(gòu)造時空語義圖Gt，其中每個DIA用作圖的節(jié)點。

　　社會交互編碼

　　智體交互的編碼，采用以下幾種神經(jīng)網(wǎng)絡：全連接層、卷積層、遞推層和圖層。

　　全連接層交互編碼的思想是，將來自不同智體的所有特征展平并連接到單個向量中，并饋送到全連接層中。理想情況下，智體之間的交互通過堆疊的全連接層之間的信息交換進行編碼和處理。然而，這些架構(gòu)中的交互建模通常被認為是非常弱和隱式的，因為缺乏數(shù)據(jù)結(jié)構(gòu)并在模型中造成歸納偏差。

　　對于神經(jīng)網(wǎng)絡來說，區(qū)分來自不同智體的特征可能具有挑戰(zhàn)性。此外，按不同順序排列智體導致不同的輸出，這可能是矛盾的，因為考慮的是相同的場景和智體。因此，但很少用于建模智體間交互。

　　卷積層交互編碼的思想是將時空特征（例如，狀態(tài)特征張量或占用網(wǎng)格圖饋送到卷積神經(jīng)網(wǎng)絡中，用于交互分析。

　　理想情況下，卷積交互編碼可以更好地利用智體之間的空間關系進行更深入的交互推理。然而，實際交互可以是局部、非局部和選擇性的，取決于具體的駕駛情況。因此，在空間網(wǎng)格上應用卷積運算是否能夠覆蓋足夠的交互信息和推理仍然是一個問題。

　　遞歸層交互編碼處理時域推理的交互編碼。

　　圖層交互編碼有望更好地處理多智體環(huán)境中的關系推理。通常，智體被表示為具有屬性的圖節(jié)點。智體之間的關系由節(jié)點之間的無向或有向邊緣表示。節(jié)點和邊緣一起構(gòu)成時空圖。然后，創(chuàng)建的圖被饋送到圖層中，用于消息傳遞中的交互學習，其中每個節(jié)點聚集其相鄰節(jié)點的特征更新其自身的節(jié)點屬性。這種圖層交互編碼具有兩個優(yōu)點：可變的智體數(shù)和置換不變性。

　　通過注意編碼社會交互

　　除了上面的神經(jīng)網(wǎng)絡層之外，另一種編碼主體之間社會交互的流行思想是注意——一種量化一個特征如何影響其他特征的機制，從而表示特征之間的關系。在實際交通中，人類在交互場景中駕駛車輛，有選擇性地計算其他交通智體的空間和時間影響。每個智體都應該關注歷史、現(xiàn)在和未來時間其他智體的駕駛行為。例如，一名駕駛員在高速公路上臨時改變車道時，會比其他車道上的車輛更加關注目標車道（target lane）的汽車。

　　那么，如何制定注意機制并設計注意模塊來捕捉這種影響呢？

　　在不損失一般性的情況下，一個簡單的想法是將每個實體矢量化，然后使用特定的功能度量來計算注意水平。以簡化的兩個智體交互場景（智體i和智體j是實體）為例，每個智體行為由獨立矢量化特征（分別表示為hi和hj）表征。如果功能測量輸出大的注意值，則智體i對智體j具有強大的影響。

　　根據(jù)最一般的定義，注意機制可以量化不同類型實體對時域空間（短期和長期）和空域空間（遠程和局部）的影響。以下有五種常用的實體表示：

　　時域注意
　　智體成對注意
　　基于空域網(wǎng)格的注意
　　基于DIA的注意
　　基于圖的注意
　　模型參數(shù)學習

　　在智體交互建模之后，需要一個訓練過程來使用數(shù)據(jù)標定模型參數(shù)，這通常是通過基于梯度的優(yōu)化算法實現(xiàn)的。根據(jù)任務的目標，設計不同的損失函數(shù)反向傳播和調(diào)整模型參數(shù)。例如，對于駕駛行為預測任務，損失函數(shù)通常會使預測與真實情況之間的誤差最小化，而對于強化學習任務，損失函數(shù)會鼓勵智體獲得更高的回報。

　　此外，損失函數(shù)的設計還取決于模型輸出的表示。許多現(xiàn)有工作具有模型輸出確定性值，其中訓練過程被視為確定性回歸器。還有一些方法采用生成概率方法，輸出這些行為和意圖的概率分布，其訓練過程是一個概率最大化過程。

　　基于圖模型

　　日常交通場景中道路用戶之間的交互是結(jié)構(gòu)化的；它們隨著不確定性的時空動態(tài)變化，其中相互關聯(lián)的部分（例如，智體、道路線、障礙物）在交通規(guī)則和社會規(guī)范的約束下組織和演變。事實上，基于圖的模型為處理交互行為的復雜性和不確定性提供了一種自然工具。

　　圖模型提供了一個直觀的界面，研究人員可以通過該界面對高度交互的變量集和數(shù)據(jù)結(jié)構(gòu)進行建模。此外，基于圖的模型通常可以解釋為人類主體之間的結(jié)構(gòu)化關系。使用圖模型，能夠設想針對特定環(huán)境的新模型。例如，圖神經(jīng)網(wǎng)絡將其節(jié)點（頂點）指定為人類智體、實例或決策相關狀態(tài)，并將節(jié)點之間的邊緣（弧）指定為交互，例如智體的速度和相對位置。

　　如圖提供了一個案例，以圖方式表示智體之間的交互關系，其中行為隨時間演變。

　　以下是三種基于圖的交通場景交互建模方法：圖神經(jīng)網(wǎng)絡、貝葉斯動態(tài)網(wǎng)絡和拓撲模型。

　　圖神經(jīng)網(wǎng)絡

　　用于交通智體交互的基于GNN模型，有不同的名稱，例如交互圖、智體圖、場景圖或交通圖。本文統(tǒng)稱為交互圖。

　　在該模型中，交互場景中的N個智體通常由具有N個智體節(jié)點（也稱為頂點）和N×N條邊緣的圖表示，這些邊緣表征它們之間的交互。交互圖可以具有一些節(jié)點屬性（例如人類駕駛員的狀態(tài)）和邊緣屬性（例如，人類駕駛員之間的關系）。除了將人類智體視為圖節(jié)點外，其他特征，例如潛目標位置（例如，車輛之間的插入?yún)^(qū)域）也可以視為圖節(jié)點。

　　設計的圖結(jié)構(gòu)可以是靜態(tài)的或動態(tài)的。借助動態(tài)圖，模型可以利用圖關聯(lián)結(jié)構(gòu)的不同交互和不同的模型輸入。在創(chuàng)建高效的交互圖之前，應考慮一些相關問題，包括：

　　如何使交互圖能夠捕獲智體在空域和時時域的依賴關系？

　　如何使學習的交互圖可轉(zhuǎn)移？

　　如何使交互圖適用于交通中的異構(gòu)智體？

　　如何將環(huán)境信息整合到交互圖中？

　　如何使交互圖與任意數(shù)量的智體兼容？

　　貝葉斯動態(tài)模型

　　貝葉斯網(wǎng)絡是一種概率圖模型（PGM）。通常，PGM被用作一種標準圖工具，用于計算具有高度結(jié)構(gòu)的大概率分布。與基于GNN的交互模型不同，BNs的節(jié)點表示隨機變量（例如，具有噪聲或離散機動的智體狀態(tài)或傳感器信息），邊緣表示條件概率分布中節(jié)點之間的隨機因果關系。這些依存關系可以用有向無環(huán)圖進行示意性表示，依賴的結(jié)構(gòu)通常反映分層生成過程，類似于條件行為預測。普通BNs提供了一個概率圖架構(gòu)，該架構(gòu)明確描述了單個時間片上智體之間的因果依賴關系，但不包括時間依賴關系，如圖（a）所示。

　　動態(tài)貝葉斯網(wǎng)絡（DBN）作為一種貝葉斯動態(tài)模型，是一種BN，包括節(jié)點的時間依賴性，簡單地說，隨著時間的推移重復普通BN的依賴性結(jié)構(gòu)，如圖（b）所示。DBN節(jié)點在這些時間片上的某些依賴性通常被視為交互的時間動態(tài)。

　　作為一般框架，DBN適用于智體交互，建立描述不確定動態(tài)過程的概率模型。在應用中，DBN中的時間依賴性通常被實現(xiàn)為確定性遞歸過程（如RNN）或一階馬爾可夫過程（如狀態(tài)空間模型）。從這個角度來看，一些SSM和RNN可以被視為DBN的特殊情況。

　　在實際交通中，道路使用者的交互行為是非線性的、上下文相關的，并隨時間演化。觀察的傳感器狀態(tài)，是其內(nèi)部模型（例如，潛/隱藏狀態(tài)）的生成和實現(xiàn)，通常是不可測量的。

　　基于BN的交互模型是一個強大的工具，可以以結(jié)構(gòu)明確的方式捕獲復雜的交互，包括物理約束、不可觀測狀態(tài)和觀測的不確定性。通常，使用DBN對交互進行建模可進行可靠的長期預測，因為其動態(tài)地考慮人類駕駛員的運動和決策之間的相互影響（或相關性）。

　　然而，模型性能在很大程度上取決于模型假設的正確性。例如，具有風險最小化假設的基于DBN模型，無法正確捕捉實際危險交通情況下的條件行為。另一方面，DBN的計算復雜度會隨著交互場景中涉及的智體數(shù)量的增加而呈指數(shù)增長。因此，目前DBN基于現(xiàn)有數(shù)據(jù)集進行離線評估和實驗室測試。

　　貝葉斯非參數(shù)動態(tài)網(wǎng)絡可以從多變量連續(xù)觀測中自動學習相關模式，而不需要模式數(shù)量的先驗知識。盡管貝葉斯非參數(shù)動態(tài)網(wǎng)絡能夠提取構(gòu)成連續(xù)行為的基本元素，但還不能直接揭示人類駕駛員在獎勵和行為方面的動態(tài)決策過程。這是因為他們的基本動態(tài)模型（如HMM、SSM）沒有考慮獎勵和動作。

　　拓撲模型

　　在交互場景中，人類是通用智體；人類行為解釋的機制是目的論（teleological）。此外，人們的決策受益于其構(gòu)建的心理表征，如拓撲結(jié)構(gòu)，在復雜的交互中取得成功，有效地簡化了推理。因此，人類將其觀測抽象為高層嵌入，是不變、可共享和可重用的交叉交互場景和行為。那么，如何定義和查找這些嵌入？

　　盡管貝葉斯非參數(shù)動態(tài)網(wǎng)絡可以在低粒度提取基元來分析高維序列，但不能考慮多智體交互的行為和幾何結(jié)構(gòu)以及目的性推理。對于多智能體行為，自然會提出兩個基本問題：

　　是否有一種方法可以從代數(shù)和幾何上將任何復雜的、時空多智體交互行為編碼為緊湊表示？

　　是否有一種措施可以識別智體軌跡保持拓撲的變形？

　　拓撲模型為這兩個問題提供了初步解決方案，可以將結(jié)構(gòu)化信息轉(zhuǎn)化為抽象形式。經(jīng)常使用兩種拓撲模型：第一個問題的拓撲編織和第二個問題的拓撲學不變性（topological invariance）。

　　社會場和社會力

　　在模擬復雜（例如，環(huán)境、內(nèi)部和社會）運動激勵下的人類駕駛交互時，在感知道路邊界和人行道等交通環(huán)境時，必須考慮人類大腦中主動產(chǎn)生的虛擬力。另一方面，考慮其他人類駕駛員對社會駕駛規(guī)則的影響也同樣重要。例如，當人類駕駛員接近交叉口并在無保護情況下左轉(zhuǎn)時，看到一輛激進前行的車輛，駕駛員將在碰撞之前改變其決定。在這個過程中，前來的車輛不會向自車施加接觸力，但人類駕駛員的反應就像存在力一樣。這種不存在但可以直觀地描述和解釋社會交互的虛擬力是社會力模型。

　　此外，力是所有交互和運動的支配和統(tǒng)一因素，基于社會力的獎勵設計可以改善多機器人導航的交互性能。因此，可以合理地假設，與人類駕駛員相關的運動（例如，前移和轉(zhuǎn)向）由人類內(nèi)心產(chǎn)生的虛擬力（例如，內(nèi)部動機、期望速度和目的地）和外部約束（例如，交通管制、障礙物和運動智體）控制和驅(qū)動。

　　從場和勢的另一個角度來看，人類駕駛員跟隨車道并與其他車輛交互的根本原因是駕駛員將自己限制在交通環(huán)境和其他因素影響形成的場中。人類駕駛員通過平衡成本和回報來生成軌跡并采取行動，這導致以勢場（potential field）為特征的總效用。虛擬力迫使人類智體向較低的場值移動，類似于物理學中電場中的帶電粒子。在討論社會力時，相應積分如勢、場和能量等無法避開。

　　另一方面，如圖所示，人駕駛車輛的運動狀態(tài)（即速度和位置）是從隨時間變化的加速度得出的。因此，直接學習加速度可以捕捉到社會力的相同交互效應。

　　在物理學中，物理量（例如速度、溫度、電和磁）在特定空間區(qū)域中的分布稱為場（field）。類似地，交通相關量（如感興趣區(qū)域中的風險或安全水平）的分布被稱為風險或安全場，稱為安全旅行場（Safe Travel Field）。場論提供了一個統(tǒng)一的框架來描述環(huán)境約束和碰撞風險，從中可以實現(xiàn)移動機器人的次/最優(yōu)軌跡和運動規(guī)劃。人類駕駛員通過感知-動作環(huán)路與周圍環(huán)境交互：實時評估環(huán)境的風險水平，預測其他智體的運動，然后對動態(tài)環(huán)境產(chǎn)生反應。

　　社會場

　　場論是一個特殊的領域，它揭示在道路行駛時縱向和橫向車輛操作交互的潛在機制。相關構(gòu)造場也用于表示人類駕駛員與交通環(huán)境之間的交互。在多車輛交互交通場景中，現(xiàn)有研究采用了許多與場理論相關的不同術語，包括風險場/地圖或駕駛員風險場、駕駛風險勢場，人工勢場，事故風險成本，或駕駛安全場等。雖然使用的術語多種多樣，但它們有共同點：人為設計和基于風險信息。社會場分為三類：風險/安全場、潛在場和占用場。

　　安全行駛區(qū)域的特征在于預定義空間上風險值的標量，形成風險場。許多因素會影響風險水平。交通心理學認為，安全旅行場由三個子場組成：人類駕駛員場、其他人類駕駛員場和汽車場本身。然而，他們沒有考慮固定交通結(jié)構(gòu)（如道路邊緣和車道線）和交通控制（如停車標志和交通燈）的影響。

　　研究人員首先定性分析人類駕駛員在交互中的典型感知反應，然后設計具有相關約束的每個子場函數(shù)。如表1列出了每個子場公式的幾種常用核函數(shù)，其中大多數(shù)是基于高斯的，因為可解釋和可微分。

　　除靜態(tài)障礙物和道路約束外，所有設計的子場都是動態(tài)的，并隨時間和空間變化。也有其他替代方法來模擬交互作用。例如，一個簡單的想法是使用純數(shù)據(jù)驅(qū)動的方法，如神經(jīng)網(wǎng)絡，但它們通常缺乏可解釋性。

　　在物理學中，電勢和場之間存在顯式和直觀的關系，例如電場和電勢，這里電場是電勢相對于距離微分的負數(shù)。與具有嚴格、客觀證明和驗證的物理定義勢不同，安全駕駛勢函數(shù)是啟發(fā)式，也是人工設計的，根據(jù)專家的見解和對人類駕駛行為的理解。

　　與風險場一樣，勢場是幾個獨立子勢場的聚合或加權和。然而，研究人員對勢場的定義有不同的看法。一些研究人員認為，移動和非移動目標都會影響勢場。

　　基于場論的方法固有的困難是參數(shù)估計。大多數(shù)研究人員根據(jù)他們對人-駕駛員互動的主觀定性判斷和評估確定了場參數(shù)。選擇最優(yōu)超參很繁瑣，這是一個NP- hard問題。雖然估計場參數(shù)似乎很難，但通過仔細設計特定駕駛行為的可計算場，已經(jīng)取得了一些有希望的進展。

　　一般來說，人類駕駛員之間的交互是復雜的，潛在和風險場的混合可以為特定實現(xiàn)的行為建模提供有效的解決方案。

　　社會力

　　這里不討論人類駕駛員與其他類道路使用者（即行人、騎自行車者和摩托車者）的交互；相反，只關心道路人類駕駛車輛之間的交互。

　　在自然交通場景中，復雜的傳感器激勵（即內(nèi)部、環(huán)境和社會）會帶來行為反應，該反應取決于人類駕駛員的目標（aims），并從一組行為備選方案中選擇使效用最大化。理性和有經(jīng)驗的人類駕駛員通常會根據(jù)其大腦習慣適應他們熟悉的情況；因此，駕駛員的反應是相對自動的，并由他們的經(jīng)驗決定哪種反應最好。

　　在這樣的觀點下，研究人員通過一個被稱為社會力的向量化，從數(shù)學上恢復了行為規(guī)則和人類主體之間的影響。人類主體和物理限制之間產(chǎn)生的社會力是導致行為變化的根源，通常由三種內(nèi)部、環(huán)境和社會激勵相對應的力組成：自驅(qū)動力、排斥力和吸引力。

　　這三類力來自行人或人群，基本上涵蓋了交通中交互駕駛行為的所有基本社會力。然而，由于行人和車輛之間的差異，有必要修改這些力，使其適合特定應用。例如，由于物理限制，對車輛加速度和角速度的限制必須比行人更嚴格。

　　此外，社會力量允許將環(huán)境物理約束和交互行為的領域知識轉(zhuǎn)化為個人的動態(tài)模型。雖然簡單設計復雜的社會力模型聽起來很合理，但它通常不會像預期的那樣起作用。通用建模過程是一個循環(huán)和迭代過程，包括原型設計、參數(shù)調(diào)整、基于仿真的評估、參數(shù)標定以及基于數(shù)據(jù)和仿真的評估，如圖所示。

　　標定一個良好的社會力模型并非易事，因為（i）大多數(shù)模型參數(shù)沒有可直接測量的當前具體解釋-其中大多數(shù)是抽象意義，（ii）一個單一參數(shù)通常會影響駕駛行為的許多方面，盡管社會力模型被假設為幾個獨立的子力模型的組合，以及（iii）駕駛行為的特定方面由一個以上參數(shù)產(chǎn)生。

　　大多數(shù)現(xiàn)有的社會力模型在沒有具體解釋的情況下以啟發(fā)式和主觀方式標定模型參數(shù)。沒有唯一的標準方法來調(diào)整這些參數(shù)或使用數(shù)據(jù)驅(qū)動技術進行模型標定。幸運的是，存在一些方法來標定行人和車輛行人的社會力模型。

　　當使用數(shù)據(jù)驅(qū)動技術進行標定時，研究人員通常將模型參數(shù)分為兩類：可測量和不可測量。可測量參數(shù)可通過傳感器直接獲得，或通過統(tǒng)計數(shù)據(jù)分析和車輛的物理限制（如最大轉(zhuǎn)向角和加速度）進行標定。而對于不可測參數(shù)，需要使用曲線擬合算法和遺傳算法非線性規(guī)劃。

　　受加速度和力之間關系的啟發(fā)，直接學習加速度是產(chǎn)生社會力的一種替代方法，而不是通過場論估計智體之間受影響力。計算認知模型

　　認知機制是使人類駕駛員通過隱式通信安全有效地與其他理性主體交互的強大屬性之一。所有捕捉人類駕駛員交互的方法都有相關的行為基礎，并得到行為和心理行為認知的支持。因此，認知理解交互是設計有效交互建模方法的前提。解決認知科學前沿的基本問題，將是在社交道路上實現(xiàn)社會兼容自主駕駛的一個解決方案。

　　現(xiàn)有關于認知模型的研究大多集中于個體的駕駛行為，而不是主體之間的交互。它們特別適用于建模單個智體在較高級別和較低級別行為之間的關系。

　　在交互過程中，駕駛員需要主動和被動地感知其周圍的車輛，根據(jù)其先驗知識對其他車輛的當前行為以及自車預期的未來潛行為作出反應，并最終根據(jù)其對環(huán)境判斷的信念做出有效決策。受交互過程的啟發(fā)，這里試圖從自車駕駛員的角度回答一些基本問題：

　　1.駕駛員會如何響應他人的行為？

　　2.駕駛員如何理解他人的行為？

　　3.駕駛員如何感知，即處理感知信息，去做出決策？

　　上述三個問題中的每一個都可以用一個特定的（但不是唯一的）認知理論來解釋。

　　激勵-響應

　　基于此，許多經(jīng)典的交互模型被開發(fā)來解釋人類駕駛員，例如經(jīng)典的跟車模型以及變道交互模型。激勵-響應交互歸類為簡單的社會交互（例如，跟車行為中的反應性交互）。

　　心理理論

　　人類是天生的讀心術；人類駕駛員天生就具有將自己置于其他駕駛員的位置并對其行為和意圖進行推理的能力。與人工機器不同，心智理論（ToM）描述了人類與其他人類主體交互能力的一個基本屬性，即人類可以對其他人類主體的心理狀態(tài)和行為進行推理。

　　一個經(jīng)典的認識是人類通過鏡像神經(jīng)元的能力，即將自己置于他人的位置的能力，能夠更好地與環(huán)境交互，并更有效地與同伴合作。例如，在高速公路上理性的人類駕駛員通常會留出空間，讓路給試圖合并的閘道車輛。

　　在交通心理學中，ToM廣泛指的是人類駕駛員在沒有明確溝通的情況下代表他人心理狀態(tài)的能力，包括他們的欲望、信念和意圖。

　　如圖（a）和（b）比較了ToM和IRL/RL的結(jié)構(gòu)，并表明可以在IRL/RL結(jié)構(gòu)下指定ToM。藍色箭頭表示人類的心理狀態(tài)推斷（即在某些觀察行為下，推斷人類不可觀察的信念和愿望），這與IRL中的問題相對應（即，根據(jù)一些觀察策略執(zhí)行，推斷出智體的世界不可觀察模型和獎勵函數(shù)）。此外，ToM可以將人類心理形式化，即給定觀察行為不可觀察變量（即信念、欲望和感知）的貝葉斯推理，這是行為的生成模型。

　　如表2還說明了ToM、IRL/RL和貝葉斯ToM的核心組件之間的聯(lián)系。

　　另一方面，ToM還提供了博弈論方法和假設，使它們在建模交互時計算上易于處理。

　　信息積累機制

　　漂移擴散模型（DDM）是一種具有擴散（Diffusion）信號的順序采樣模型。決策者積累證據(jù)，直到達到上限或下限，然后停止并選擇對應于該邊界的備選方案。

　　一個典型的例子是在無信號環(huán)行交叉口匯入交通流時的決策過程。駕駛員在附路的環(huán)形交叉路口等待，直到目標“間隙”達到可接受程度。等待時間是駕駛員做出匯入風險決策的概率累積指標：等待時間越長，做出的風險決策就越大。許多現(xiàn)有的工作只關注駕駛員將做出什么決策，例如行為建模和預測，而較少關注該過程如何操作，以及隨著觀察到越來越多的信息去觸發(fā)決策。

　　請注意，為了揭示做決策時如何使用感知信息（即感知決策），行為科學中通常存在四種決策理論：理性模型、完善理性、證據(jù)累積和并行約束滿足模型。然而，到目前為止，只有證據(jù)積累被用于解釋交通場景中的人類駕駛行為。

　　討論

　　一些問題和可能的方向：

　　1 社會交互模型是真得社會覺察嗎？2 模型假設和數(shù)據(jù)集之間的移動3 認知科學能幫助自動駕駛車做到社會兼容？4 軌跡預測模型越精準就越好嗎？

　　總結(jié)一下：

　　道路交通的交互：什么角色？什么時候？

　　其中提到三種方法：潛在沖突檢查、RoI設置和面向任務的智體選擇。

　　基于潛在沖突的方法將低估交互，因為根據(jù)潛在沖突定義，例如智體之間的通行權。然而，駕駛過程中的一些社會交互并非源自潛在沖突，而是源自凝聚力。例如，一個好斗的司機會模仿他/她前車的行為，在十字路口面對黃燈時采取機會主義行動向前沖。

　　應該強調(diào)的是，潛在沖突的方法不會將其視為一種交互。如果假設占據(jù)RoI的所有智體都相互作用，則RoI方法可能會高估交互作用。在自然交通中，并非RoI中的所有智體都在交互網(wǎng)絡中激活；相反，人類駕駛員可能僅與某些智體直接交互。

　　此外，RoI的大小通常也難以配置，因為它與任務和環(huán)境相關。面向任務的智體選擇是模擬人類駕駛員如何交互的理想方法。然而，建立這種類型的模型具有挑戰(zhàn)性，因為交互過程的了解很少是先驗的。此外，人類在決策過程中的選擇性注意是動態(tài)和隨機的），這需要時域適應的模型。

　　基于理性效用的建模

　　理性人類駕駛行為是對動態(tài)環(huán)境做出響應的所有可能解決方案中“接近最優(yōu)”或“最優(yōu)”結(jié)果。這一觀察結(jié)果，能夠?qū)⑷伺c人之間的交互表述為一個可計算的優(yōu)化模型，最大化特定的目標。另一種流行的行為優(yōu)化方法是速度障礙（VO，velocity obstacles），用于模擬人類駕駛交互同時保證無碰撞，該方法已廣泛應用于多機器人領域。該方法成功地模擬異構(gòu)交通環(huán)境中的交互和交通軌跡的預測。

　　基于優(yōu)化的方法在分析上可以解釋，在數(shù)學上可以證明，包括不同的約束以避免碰撞。然而，對于具有滿意計算性能的在線應用程序來說，解決此類復雜優(yōu)化問題將是一個挑戰(zhàn)。

　　基于神經(jīng)網(wǎng)絡的建模

　　基于深度學習的方法提供了一種靈活的網(wǎng)絡架構(gòu)，用于表示和學習交通智體之間的交互，得益于模塊化的層結(jié)構(gòu)和豐富的數(shù)據(jù)。基于深度學習的方法已經(jīng)通過許多與駕駛相關的挑戰(zhàn)、競賽和排行榜中占據(jù)領先地位而顯示出其力量和前景。未來，為了在真正的自主駕駛系統(tǒng)上安全地大規(guī)模部署，仍然存在許多挑戰(zhàn)，例如（i）在保證性能的同時提高可解釋性，以及（ii）在各種駕駛實體、場景和情況下增強通用性。

　　基于圖的模型建模

　　人類駕駛員之間學習的時空交互可以將節(jié)點作為矢量化時空特征的圖模型來推理車輛關系。雖然GNN和帶有張量融合的社交池化可以方便地使用輔助信息以端到端的方式訓練網(wǎng)絡，但它們無法確保所需的物理或社會因素是否被實際捕獲和學習（即缺乏可解釋性）。

　　大多數(shù)用圖模型進行多智體行為和軌跡預測的工作，都是通過仔細采用這些預測來實現(xiàn)社會兼容自主車輛的安全路徑規(guī)劃和控制設計。然而，當其應用于人類駕駛-自主駕駛的混合環(huán)境時，在沒有自主智體的情況下，所導出的交互模型準確性是值得懷疑的，因為人類駕駛員可能對自動駕駛汽車有不同的行動。這些模型忽略自主系統(tǒng)對人類智體的影響。此外，GNN提供了直觀的理解，但在數(shù)量上并不精確，這不足以用于安全-緊要應用，如自動駕駛。

　　社會力和社會場的方法

　　借用物理學中場的概念（例如，電學理論中的電場或磁場）來創(chuàng)建一個驅(qū)動自身的虛擬場，一種在幾個方面與社會因素相結(jié)合、相當特殊的場。社會場和社會力提供了一個概念上統(tǒng)一的框架，解釋不同場景中的駕駛員行為，因此可以用于風險評估、最優(yōu)控制、行為預測和路徑規(guī)劃。

　　此外，它們還可以靈活利用其他交通因素。基于場論的模型通常是根據(jù)研究者對人類駕駛行為的主觀認知和理解，通過定量分析建立的。因此，可以利用許多因素，例如道路屬性（例如直線和曲線道路）、交通條件、車輛屬性（例如形狀和質(zhì)量）和人為因素（例如駕駛員的注意）。

　　理論上，基于場的模型可以處理復雜的場景，但僅在簡單的交互場景中得到驗證，例如，兩個智體之間的車輛跟隨和變道交互，這是由于大量的標定工作造成的。

　　生成場的元素更具選擇性。并非環(huán)境中的所有元素和智體（部分元素和智體）都對任務性能有顯著影響。這是因為主導運動和駕駛?cè)蝿盏南嚓P元素出現(xiàn)，而非相關元素通常會遠離到背景中。

　　此外，根據(jù)兩個人在交互的角色，他們之間的影響可能是不對稱的。例如，周圍的車可能是領頭車、停放車、尾端車、匯入車等，它們對自車的潛在影響是不同的。每一類汽車可能共享相同的勢場，從而形成更緊湊的勢場模型。

　　安全旅行場本質(zhì)上是客觀或和主觀的表征。一些研究人員將駕駛風險場視為一個物理場，并聲稱這是一個客觀特征，不會隨個人的主觀意愿而變化。從“上帝的角度”來看，這可能是正確的——如果從鳥瞰的角度分析互動行為的話。

　　然而，如果從第一人稱角度分析自車的交互行為，并考慮社會因素，這個結(jié)論可能是錯誤的。該場是人類駕駛員主動和被動感知的風險場，反映了人類駕駛員在社會互動中的行為和反應，因此本質(zhì)上是一種主觀表征。

　　計算認知模型

　　計算認知為理解人類駕駛員之間社會交互中各種認知功能的本質(zhì)提供了新的視角。借鑒認知計算神經(jīng)科學的思想和發(fā)現(xiàn)，一些工作解釋人類駕駛員在交互中的決策過程。

　　然而，一方面，現(xiàn)有方法通常提供過多的細節(jié)，例如，描述低級神經(jīng)現(xiàn)象，使模型顯得過大。另一方面，有些方法過于簡單，在實踐中難以處理，例如，僅在實驗室環(huán)境中進行測試，缺乏復雜駕駛環(huán)境中的原則性調(diào)查，或提供決策的高級認知結(jié)構(gòu)。因此，在實時預測人類駕駛行為中實現(xiàn)這些機制的主要實驗室機制和實際應用之間存在著挑戰(zhàn)性的差距。

　　討論

　　很多交互模型未能調(diào)查對抗性魯棒性，沒有從社會理解的角度評估這些模型與社會行為的一致性。社會理解可以揭示當前模型的局限性，從而提供未來可能的方向。

　　在許多交通應用中，模型魯棒性仍然是一個核心問題。這可能是由設計模型和生成數(shù)據(jù)之間的不匹配造成的，包括兩個方面。

　　交互模型設計以目標為導向，但人類駕駛員產(chǎn)生的行為主要是習慣性的。這種行為最初是以目標為導向的，但后來在整個體驗中形成習慣。例如，一個新的駕駛員用一系列由教師制定的具體子目標來規(guī)劃行動。然后，駕駛員消化這些步驟并將其轉(zhuǎn)化為習慣，無需設定這些特定的子目標。基于習慣生成的數(shù)據(jù)集來訓練目標導向模型，可能會削弱模型的泛化能力。對于模型假設和數(shù)據(jù)之間的飄移，一種可能的解決方案可能是，制定基于模型和無模型的框架。

　　交互模型設計是社會導向的，但行為數(shù)據(jù)是通過物理交互和社會交互混合生成。在開發(fā)交互模型時，大多數(shù)工作直接建模其交互軌跡，例如使用圖神經(jīng)網(wǎng)絡（GNN），但忽略了對交互行為產(chǎn)生的原因和方式的洞察。反事實（Counterfactual）僅使用社會交互假設模型來近似社會和物理交互行為。

　　因此，深入了解相關數(shù)據(jù)，為AI算法提供動力，可能是自動駕駛車輛具有社會兼容性和魯棒性的關鍵之一。

　　完美的自動駕駛需要超越路徑跟蹤、目標檢測和防撞的直覺心理。由于技術障礙和社會障礙，沒有直覺心理的自動汽車等路上無意識機器，與其他人類駕駛員共享道路空間還為時過早。

　　社會兼容的自動駕駛車輛應能夠發(fā)現(xiàn)其他人類智體的心理狀態(tài)和看法，與其他道路使用者進行安全和可接受的交互。換言之，最終目標是制造像理性的人類駕駛員一樣思考和學習的自動駕駛汽車。

　　然而，在他們學習的內(nèi)容和學習方式方面，真正類似人類的學習和思考能力超出了當前的工程動態(tài)。社會兼容的自主駕駛，迫使開發(fā)有效的工具，用結(jié)構(gòu)化計算認知模型的觀察來解釋和理解潛在的決策過程。

　　智體行為預測和推理已被公認為安全-緊要交互系統(tǒng)設計中不可或缺的一部分；例如，在人類環(huán)境中進行協(xié)商的自動駕駛車輛，需要在其規(guī)劃和決策中利用人類駕駛車輛的未來行為。

　　更多的工作熱衷于在復雜場景中對移動車輛進行更高精度的軌跡預測。在實踐中，需要仔細考慮“模型需要多精確才能成功交互”，而不是盲目追求軌跡預測的準確性，有必要考慮人類認知和行為的哪些方面對交互性能影響最大。

　　對于不同的實際任務，進行非常高精度的軌跡預測可能不會有利于整個交互性能，盡管它可能有利于低級控制器的設計。人類駕駛員的預測可能不如機器（例如，自動駕駛車輛）準確，但他們?nèi)阅苓M行有效的交互。

　　結(jié)論

　　了解人類駕駛員如何與他人交互是開發(fā)社會兼容自動駕駛車輛的一個核心問題。隨著自動駕駛車輛在社交道路上與其他人類智體的交互越來越緊密，有定量模型來預測這些交互行為變得越來越重要。

　　本文首先明確定義了道路交通中的社會交互。然后，它不可避免地對人類駕駛員和相關應用之間的交互作用進行了選擇性回顧，包括基于理性效用的模型、基于深度學習的模型、圖模型、社會場/力和計算認知模型。最后提出了關鍵的發(fā)現(xiàn)和開放的問題，這可以為自動駕駛車輛與人駕駛車輛的交互提供新的方向。

　　編輯：黃飛

閱讀全文

傳感器(738426) 傳感器(738426)
神經(jīng)網(wǎng)絡(98382) 神經(jīng)網(wǎng)絡(98382)
自動駕駛(162871) 自動駕駛(162871)
深度學習(119797) 深度學習(119797)
AI算法(12083) AI算法(12083)

阿里智能對話交互實踐及范式思考

阿里巴巴的孫健博士表示，對于研發(fā)對話交互機器人的幾點思考和體會：堅持用戶體驗為先；降低產(chǎn)品和交互設計的不確定性；打造讓機器持續(xù)學習能力；打造數(shù)據(jù)閉環(huán)。

2017-07-12 16:41:54

2833

2017全國深度學習技術應用大會

學習的手寫文字識別新方法，介紹面向文字識別的DropSample、DropSegment等深度學習訓練技術，并展示我們基于深度學習的幾個應用演示系統(tǒng)，包括在線大類別文字識別、人臉美麗顏值打分、面向特定

2017-03-22 17:16:00

深度學習DeepLearning實戰(zhàn)

一：深度學習DeepLearning實戰(zhàn)時間地點：1 月 15日— 1 月18 日二：深度強化學習核心技術實戰(zhàn)時間地點： 1 月 27 日— 1 月30 日(第一天報到授課三天；提前環(huán)境部署電腦

2021-01-09 17:01:54

深度學習與數(shù)據(jù)挖掘的關系

深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究。含多隱層的多層感知器就是一種深度學習結(jié)構(gòu)。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。晦澀難懂的概念，略微有些難以

2018-07-04 16:07:53

深度學習介紹

汽車安全系統(tǒng)的發(fā)展進步中發(fā)揮重要的作用。而這些系統(tǒng)遠不止僅供典型消費者群體掌握和使用。深度學習這一概念在幾十年前就已提出，但如今它與特定的應用程序、技術以及通用計算平臺上的可用性能更密切相關。深度學習

2022-11-11 07:55:50

深度學習在汽車中的應用

運行的深度學習/基于CNN的應用程序，以在高效的嵌入式平臺上提供極具吸引力的高級駕駛輔助系統(tǒng)（ADAS）功能。圖 3：TIDL框架（TI器件轉(zhuǎn)換器和深度學習庫）TIDL框架為軟件可擴展性提供快速

2019-03-13 06:45:03

深度學習存在哪些問題？

深度學習常用模型有哪些？深度學習常用軟件工具及平臺有哪些？深度學習存在哪些問題？

2021-10-14 08:20:47

深度學習技術的開發(fā)與應用

/A2C6.DDPG7.PPO8.SAC1.深度強化學習訓練場-OpenAI Gym 安裝與使用2.Pytorch安裝與使用3.自動駕駛賽車任務4.月球飛船降落任務實操解析與訓練一實驗：倒立擺和冰壺控制實踐1.環(huán)境編寫

2022-04-21 14:57:39

深度學習是什么

創(chuàng)客們的最酷“玩具”　　智能無人機、自主機器人、智能攝像機、自動駕駛……今年最令硬件創(chuàng)客們著迷的詞匯，想必就是這些一線“網(wǎng)紅”了。而這些網(wǎng)紅的背后，幾乎都和計算機視覺與深度學習密切相關。　　深度學習

2021-07-19 06:17:28

深度學習框架只為GPU?

CPU優(yōu)化深度學習框架和函數(shù)庫機器學***器

2021-02-22 06:01:02

深度學習模型是如何創(chuàng)建的？

具有深度學習模型的嵌入式系統(tǒng)應用程序帶來了巨大的好處。深度學習嵌入式系統(tǒng)已經(jīng)改變了各個行業(yè)的企業(yè)和組織。深度學習模型可以幫助實現(xiàn)工業(yè)流程自動化，進行實時分析以做出決策，甚至可以預測預警。這些AI

2021-10-27 06:34:15

深度強化學習實戰(zhàn)

2021-01-10 13:42:26

AI/自動駕駛領域的巔峰會議—國際AI自動駕駛高峰論壇

已經(jīng)滲透到了社會生活的方方面面。人工智能在自動駕駛領域?qū)φ麄€汽車出行領域產(chǎn)生顛覆性變革。汽車的人工智能技術和數(shù)據(jù)后端的最新突破使自動駕駛成為可能。深度學習、高級數(shù)字助理和動態(tài)電子視野方面的新科技

2017-09-13 13:59:54

FPGA在深度學習應用中或?qū)⑷〈鶪PU

、筆記本電腦或機架式服務器上訓練神經(jīng)網(wǎng)絡時，這不是什么大問題。但是，許多部署深度學習模型的環(huán)境對 GPU 并不友好，比如自動駕駛汽車、工廠、機器人和許多智慧城市環(huán)境，在這些環(huán)境中硬件必須忍受熱、灰塵、濕度

2024-03-21 15:19:45

Nanopi深度學習之路(1)深度學習框架分析

://www.sohu.com/a/204207587_99960938而我現(xiàn)在要考慮的是跨平臺、跨系統(tǒng)性能強，并支持Nanopi2的深度學習算法庫。近兩年TensorFlow開源后，對于初學深度學習

2018-06-04 22:32:12

Nanopi深度學習之路(2)深度學習框架安裝前的系統(tǒng)配置

Nanopi2進行深度學習的模型訓練，簡直就是小貓拉火車，但是，它可以用于配置訓練好后的學習模型，可能有點像交叉編譯的意思，當然這并不恰當。現(xiàn)在Nanopi2官方發(fā)布的系統(tǒng)已有很多，但我認為最健全、穩(wěn)定的還是

2018-06-05 17:29:51

x86平臺架構(gòu)如何為用戶帶來豐富的交互式駕駛體驗？

本文主要講述了x86平臺架構(gòu)如何為用戶帶來豐富的交互式駕駛體驗，而這是非PC兼容型平臺難以實現(xiàn)的。

2021-05-14 06:45:15

『深思考』打造人工智能機器大腦，讓AI更懂你！

的問題”楊志明說。深思考人工智能機器人（iDeepWise.ai）4.0在多模態(tài)深度語義理解方面有突出優(yōu)勢。深度語義理解使得機器人能夠理解上下文，與人進行多輪交互。讓機器與人的交流更加流暢，更接近于人與人之間

2018-09-13 09:40:58

【AD新聞】龍芯展示新版國產(chǎn)自主筆記本電腦：自主CPU+深度OS

日前，龍芯展示了新版國產(chǎn)自主筆記本電腦。該PC產(chǎn)品運行最新的龍芯3A3000處理器，系統(tǒng)是基于深度Linux開發(fā)版打造的龍芯鏡像，集成深度應用商店。核心CPU參數(shù)上，龍芯3A3000基于中芯28nm

2017-09-19 08:54:26

【米爾FZ3深度學習計算卡試用體驗】AI系統(tǒng)基礎上擴展接口

AI系統(tǒng)基礎上擴展接口1 擴展的必要性FZ3深度學習板卡裝載了AI系統(tǒng)，但是其數(shù)據(jù)僅僅只能在該系統(tǒng)內(nèi)部，缺乏與外界交流的媒介，無法將自身寶貴的數(shù)據(jù)傳遞給外界，盡管現(xiàn)有的系統(tǒng)以及百度AI系統(tǒng)自身已經(jīng)

2020-12-29 09:58:07

了解ADI在AR、VR、自主駕駛等領域的人機交互解解決方案

``本文轉(zhuǎn)自：ezchina點analog點com斜thread斜17974 汽車應用演示ADI在自主駕駛、駕駛室電子產(chǎn)品、MEMS 安全和安保、EV 和 HEV 動力總成以及汽車電源管理方面

2018-03-31 18:43:21

人工智能AI-深度學習C#&LabVIEW視覺控制演示效果

本帖最后由 wcl86 于 2021-5-18 22:39 編輯你將會學到的：1、解決如何讓機器能夠模仿人腦的思考方式，從而擺脫原來的固有數(shù)據(jù)庫比較的限制，讓機器能夠通過深度學習理解這個世界

2020-11-27 11:54:42

人工智能對汽車芯片設計的影響是什么

點擊上方“藍字”，關注我們，感謝！人工智能(AI)以及利用神經(jīng)網(wǎng)絡的深度學習是實現(xiàn)高級駕駛輔助系統(tǒng)(ADAS)和更高程度車輛自主性的強大技術。隨著人工智能研究的快速發(fā)展，設計人員正面臨激烈的競爭

2021-12-17 08:17:41

人機交互Topic推薦-AMiner 精選資料分享

、智能指派、學術地圖等科技情報專業(yè)化服務。系統(tǒng)2006年上線，吸引了全球220個國家/地區(qū)1000多萬獨立IP訪問，數(shù)據(jù)下載量230萬次，年度訪問量超過1100萬，成為學術搜索和社會網(wǎng)絡挖掘研究的重要

2021-09-10 07:16:04

什么是深度學習？

深度學習是什么意思

2020-11-11 06:58:03

什么是深度學習？使用FPGA進行深度學習的好處？

延遲，這對深度學習推理也很有效。上述圖像識別的深度學習有望應用于自動駕駛等對精度要求較高的系統(tǒng)中。然而，由于它也是一個具有嚴格延遲約束的系統(tǒng)，因此可能難以通過 CPU 和 GPU 實現(xiàn)，它們?nèi)菀资艿?/div>

2023-02-17 16:56:59

什么是人工智能、機器學習、深度學習和自然語言處理？

如下。深度學習是一種基于人工神經(jīng)網(wǎng)絡的機器學習，通過多層次的處理，逐步從數(shù)據(jù)中提取更高層次的特征自然語言處理是一個相關的多學科領域。它的目標是使機器(計算機)能夠理解、處理和與自然的人類語言交互。語言

2022-03-22 11:19:16

全高級駕駛員的感知系統(tǒng)

道路安全從摩爾定律中受益良多，處理能力的提升以及 CMOS 圖像傳感器 (CIS) 和其他傳感器技術的發(fā)展，讓車輛制造商得以推出高級駕駛員感知系統(tǒng) (ADAS)。ADAS 能增強駕駛員對周邊環(huán)境的感知，減少發(fā)生碰撞的概率。部分系統(tǒng)還能夠監(jiān)控駕駛員并向駕駛員發(fā)出告警，例如在駕駛員打盹時。

2020-05-13 08:12:39

可擴展圖像傳感器平臺用于先進駕駛輔助系統(tǒng)和自動駕駛

汽車行業(yè)正從SAE L2（車輛在人類監(jiān)督下控制加速、剎車和轉(zhuǎn)向）向完全自主的L5（車輛無需與人互動）發(fā)展，因此對強大圖像傳感器的需求日益增長，以支持先進駕駛輔助系統(tǒng)(ADAS)和自動駕駛的各種攝像機

2018-10-11 14:26:38

如何實現(xiàn)無縫駕駛的智能系統(tǒng)？

互聯(lián)汽車帶來更智能的駕駛體驗自主駕駛的互聯(lián)汽車實現(xiàn)無縫駕駛的智能系統(tǒng)

2021-03-09 06:20:45

射頻系統(tǒng)的深度學習【回映分享】

本文由回映電子整理分享，歡迎工程老獅們參與學習與評論內(nèi)容? 射頻系統(tǒng)中的深度學習? Deepwave Digital技術? 信號檢測和分類示例? GPU的實時DSP基準測試? 總結(jié)回映電子是一家

2022-01-05 10:00:58

無人駕駛與自動駕駛的差別性

等方面更有重要的差別。無人駕駛汽車具有創(chuàng)造創(chuàng)新性社會價值的潛力，從而深刻影響人們的生活。發(fā)展目的和表現(xiàn)不同：輔助駕駛、自動駕駛的本質(zhì)是汽車駕駛系統(tǒng)的模塊疊加和功能發(fā)展，其目的是給駕駛者提供更加便捷、安全

2017-09-28 16:50:52

智能駕駛域控制器的SoC芯片選型

。經(jīng)過多傳感器和時序信息融合，轉(zhuǎn)化為環(huán)境的統(tǒng)一表示，然后經(jīng)過運動預測和決策規(guī)劃模塊生成本車的行駛軌跡，并轉(zhuǎn)換成車輛控制信號輸出到車輛執(zhí)行器，從而完成自主駕駛的行為。整個系統(tǒng)處理過程通常需要涉及以下幾種

2022-08-11 15:55:37

機器學習、深度學習、卷積神經(jīng)網(wǎng)絡...人工智能時代的曙光

還看到自動駕駛汽車撞上了一輛公交車，這些是人工智能的成功和失敗，還是那些編程和設計這些系統(tǒng)的工程師們的成功和失敗呢？我們能夠知道像AlphaGo這樣的深度學習機器里面到底發(fā)生了什么嗎？答案當然是

2018-05-22 09:54:43

機器學習算法如何用于制造無人駕駛汽車？

機器學習算法如何用于制造無人駕駛汽車

2021-03-18 06:27:18

用于先進駕駛輔助系統(tǒng)和自主駕駛的集成智能傳感器健康監(jiān)測裝置概述

傳感器正用于汽車中，這導致了自主駕駛的方式。今天的原始數(shù)據(jù)傳感器可以結(jié)合健康監(jiān)控功能，遠程并自主地監(jiān)控故障，節(jié)省處理器資源并提供額外的系統(tǒng)保護層。這使得這些“健康智能”模塊可更容易地部署未來車輛所需的更多

2019-07-30 04:45:09

自動駕駛汽車的處理能力怎么樣？

功能；但作為一個行業(yè)，我們僅僅是才觸及ADAS系統(tǒng)的表面，更不用說完全自主駕駛了。示意圖：自動駕駛的五個級別自動駕駛的級別

2019-08-07 07:13:15

自動駕駛車的人車交互接口設計方案

隨著高精度傳感、自動化、人工智能等技術的飛速發(fā)展，預計到2021年市場上會出現(xiàn)第一批完全沒有方向盤等駕駛控制器的自動駕駛量產(chǎn)車。當汽車可以自主地完成駕駛任務時，汽車的內(nèi)飾和交互設計將具有更多想象空間

2020-07-30 07:57:43

計算機視覺應用深度學習

怎樣從傳統(tǒng)機器學習方法過渡到深度學習？

2021-10-14 06:51:23

設計一套自動駕駛系統(tǒng)，如何確保攝像頭進行可靠通信？

汽車正在快速演化成一臺安全聯(lián)網(wǎng)的自動駕駛機器人，能夠感測環(huán)境、進行思考并采取自主措施。變化更快的也許是小型自動駕駛公共車輛——出租車、拼車或公交車，能夠?qū)⑽覀儚墓步煌ㄕ尽⑹兄行幕蜣k公區(qū)域帶到想去的地方(最后一公里)。有沒有更好的ADAS系統(tǒng)解決方案，對接口進行銜接？

2019-02-20 09:29:13

請問一下什么是深度學習？

2021-08-30 07:35:21

通過深度學習提高和發(fā)展車輛感知

3D環(huán)視。人類能力邊界隨大腦發(fā)展得以拓寬，類似地，ADAS技術進步建立的基礎是運行于日益高效的硬件平臺上的創(chuàng)新感知算法。深度學習概述當今自動駕駛領域最熱門的話題之一是…

2022-11-10 08:09:48

高級駕駛輔助系統(tǒng)是一個令人興奮的市場空間

作為TI高級駕駛員輔助系統(tǒng)（ADAS）團隊的部門總經(jīng)理，我看到了這項技術在提供全方位更安全、更舒適和消息更廣的駕駛體驗方面所展現(xiàn)的令人難以置信的演變。在TI，我們的片上系統(tǒng)（SoC）ADAS產(chǎn)品

2019-07-18 04:45:06

高級安全駕駛員輔助系統(tǒng)介紹

要實現(xiàn)汽車自動駕駛，需要消除很多法律、社會和結(jié)構(gòu)障礙。盡管幾乎我們所有人都在科幻小說或電影中見識過“自動駕駛”汽車，但真要相信機器或車載電腦能在各種條件下帶著我們四處游蕩就是另外一回事了。此外，發(fā)生

2022-11-22 06:43:30

高級安全駕駛員輔助系統(tǒng)助力自動駕駛

作者：Hannes Estl要實現(xiàn)汽車自動駕駛，需要消除很多法律、社會和結(jié)構(gòu)障礙。盡管幾乎我們所有人都在科幻小說或電影中見識過“自動駕駛”汽車，但真要相信機器或車載電腦能在各種條件下帶著我們四處游蕩

2018-09-14 11:03:54

新一代虛擬駕駛仿真平臺

概述隨著智能駕駛系統(tǒng)功能的提升，駕駛員與智能駕駛系統(tǒng)之間的交互功能越來越多，測試的復雜度也越來越高。經(jīng)緯恒潤新推出的虛擬駕駛仿真平臺，可以在實驗室環(huán)境下提供逼真的虛擬駕駛場景、真實的駕駛座艙環(huán)境

2022-06-07 11:34:49

基于機械CAD基礎的自主學習系統(tǒng)

　　隨著計算機技術的發(fā)展，越來越多的課程都使用以計算機為手段的電子教學系統(tǒng)。電子教學手段可以激發(fā)學生的學習興趣，提高課程的學習效率。以往的《機械CAD 基礎》自主

2010-09-08 10:19:44

953

OCPA仿生自主學習系統(tǒng)及在機器人姿態(tài)平衡控制上的應用_蔡建羨

OCPA仿生自主學習系統(tǒng)及在機器人姿態(tài)平衡控制上的應用_蔡建羨，在學習平衡小車上面也許會有啟發(fā)。

2016-04-07 10:36:26

深度學習在無人駕駛環(huán)境感知中的應用方案

機器深度學習是近年來在人工智能領域的重大突破之一，它在語音識別、自然語言處理、計算機視覺等領域都取得了不少成功。由于車輛行駛環(huán)境復雜，當前感知技術在檢測與識別精度方面無法滿足自動駕駛發(fā)展需要，深度學習被證明在復雜環(huán)境感知方面有巨大優(yōu)勢。

2016-11-02 17:12:04

5780

最基本的深度學習系統(tǒng)的硬件指南

由于深度學習的計算相當密集，所以有人覺得必須要購買一個多核快速CPU，也有人認為購買快速CPU可能是種浪費。那么，這兩種觀點哪個是對的？其實，在建立深度學習系統(tǒng)時，最糟糕的事情之一就是把錢浪費

2017-09-22 15:17:32

深度學習的三種基本結(jié)構(gòu)及原理詳解

深度學習是計算機領域中目前非常火的話題，不僅在學術界有很多論文，在業(yè)界也有很多實際運用。本篇博客主要介紹了三種基本的深度學習的架構(gòu)，并對深度學習的原理作了簡單的描述。機器學習技術在當代社會已經(jīng)發(fā)揮

2017-11-15 11:53:01

47804

深度學習助陣無人駕駛攻克三大識別技術

深度學習在無人駕駛領域主要用于圖像處理，也就是攝像頭上面。當然也可以用于雷達的數(shù)據(jù)處理，但是基于圖像極大豐富的信息以及難以手工建模的特性，深度學習能最大限度的發(fā)揮其優(yōu)勢。現(xiàn)在介紹一下全球攝像頭

2017-11-20 11:25:49

深度學習中最核心的問題之一：訓練數(shù)據(jù)

今天我們將討論深度學習中最核心的問題之一：訓練數(shù)據(jù)。深度學習已經(jīng)在現(xiàn)實世界得到了廣泛運用，例如：無人駕駛汽車，收據(jù)識別，道路缺陷自動檢測，以及交互式電影推薦等等。

2017-12-25 10:34:28

10255

ADAS要如何運用深度學習？

北京交通大學電子信息工程學院袁雪副教授給我們講解了在高級輔助駕駛系統(tǒng)（ADAS）中的多任務深度學習框架的應用。

2018-07-15 11:28:00

4977

深度學習是什么？無人駕駛攻克三大識別技術不在話下

2018-04-30 01:17:00

2836

智能語音交互或成車聯(lián)網(wǎng)主流交互方式

車聯(lián)網(wǎng)的本質(zhì)，就是實現(xiàn)人、車、網(wǎng)、路、物的互聯(lián)融合與交互。汽車的駕駛位是駕駛員和車之間交互的唯一接口，未來的智能化汽車會成為一個功能高度集成化的生活空間，將會實現(xiàn)汽車和駕駛員的深度交互。

2018-03-11 09:07:01

2557

關于螞蟻金服副總裁胡喜對自主研發(fā)的一些思考

中興事件將自主研發(fā)這個行業(yè)話題炸成了社會熱點，也讓阿里巴巴在5年前發(fā)起的去IOE化運動被重新提起。這個被雙11指數(shù)級增長的交易量倒逼出的技術選擇，是中國互聯(lián)網(wǎng)公司走上自研道路的經(jīng)典案例。5月11

2018-06-11 14:46:00

3501

針對智能駕駛應用，深度學習應該如何落地呢？

張暉認為，主要存在著兩大關鍵點，第一需要貼近任務和系統(tǒng)需求，即必須針對智能駕駛系統(tǒng)應用對感知層的需求來進行網(wǎng)絡設計，切不可為了使用深度學習而選擇深度神經(jīng)網(wǎng)絡；

2018-07-03 16:53:06

4495

探討深度學習在自動駕駛中的應用

深度強化學習的理論、自動駕駛技術的現(xiàn)狀以及問題、深度強化學習在自動駕駛技術當中的應用及基于深度強化學習的禮讓自動駕駛研究。

2018-08-18 10:19:57

4854

深度學習是什么？了解深度學習難嗎?讓你快速了解深度學習的視頻講解

本深度學習是什么？了解深度學習難嗎?讓你快速了解深度學習的視頻講解本文檔視頻讓你4分鐘快速了解深度學習深度學習的概念源于人工智能的人工神經(jīng)網(wǎng)絡的研究。含多隱層的多層感知器就是一種深度學習結(jié)構(gòu)。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

2018-08-23 14:36:16

運用工業(yè)設計原理對機械CAD自主學習系統(tǒng)進行優(yōu)化改善

制作，較少從工業(yè)設計角度考慮人機界面、色彩設計、文字設計及人機交互設計等因素，缺乏人性化設計。本文運用工業(yè)設計原理。對原有的自主學習系統(tǒng)進行重新設計，取得了良好的教學效果，并為其他課程的自主學習系統(tǒng)設計提供了良好的思路。

2019-09-23 08:04:00

1160

如何通過MEC構(gòu)造基于深度學習的自動駕駛汽車緩存

本文通過使用部署在多接入邊緣計算（MEC）結(jié)構(gòu)上的深度學習方法，為自動駕駛汽車提出了基于深度學習的緩存。通過仿真測試，結(jié)果發(fā)現(xiàn)該方法可以最大限度地減少延遲。

2018-10-10 09:26:32

4217

零基礎入行深度學習

深度學習到底有多熱，這里我就不再強調(diào)了，也因此有很多人關心這樣的幾個問題，“適不適合轉(zhuǎn)行深度學習（機器學習）”，“怎么樣轉(zhuǎn)行深度學習（機器學習）”，“轉(zhuǎn)行深度學習需要哪些入門材料？”等等。

2018-10-19 14:07:19

2467

探究深度學習在目標視覺檢測中的應用與展望

目標視覺檢測是計算機視覺領域的一個重要問題，在視頻監(jiān)控、自主駕駛、人機交互等方面具有重要的研究意義和應用價值.近年來，深度學習在圖像分類研究中取得了突破性進展，也帶動著目標視覺檢測取得突飛猛進的發(fā)展。

2019-01-13 10:59:23

5482

如何基于深度神經(jīng)網(wǎng)絡設計一個端到端的自動駕駛模型？

如何基于深度神經(jīng)網(wǎng)絡設計一個端到端的自動駕駛模型？如何設計一個基于增強學習的自動駕駛決策系統(tǒng)？

2019-04-29 16:44:05

4404

深度學習技術與自動駕駛設計的結(jié)合

在過去的十年里，自動駕駛汽車技術取得了越來越快的進步，主要得益于深度學習和人工智能領域的進步。作者就自動駕駛中使用的深度學習技術的現(xiàn)狀以及基于人工智能的自驅(qū)動結(jié)構(gòu)、卷積和遞歸神經(jīng)網(wǎng)絡、深度強化學習

2019-10-28 16:07:19

1831

百度飛槳深度學習平臺攜手IC設計領導廠商MediaTek

百度飛槳是自主研發(fā)、開源開放、功能最完備的產(chǎn)業(yè)級深度學習平臺，集深度學習核心框架、基礎模型庫、端到端開發(fā)套件、工具組件和服務平臺于一體，包含完整的開發(fā)、訓練、推理的端到端深度學習AI模型開發(fā)工具鏈。

2020-05-29 14:59:40

2667

基于深度學習的ADAS系統(tǒng)，是GPU的主力市場

事實上，今天在汽車行業(yè)，GPU的用例幾乎涵蓋了從ADAS到自動駕駛，從儀表到中控信息娛樂等等多個車載系統(tǒng)。而在實際大規(guī)模量產(chǎn)落地領域，基于深度學習的ADAS系統(tǒng)，是GPU的主力市場。

2020-08-22 09:48:51

2003

自動駕駛汽車深度學習如何應對挑戰(zhàn)，有哪些解決方法

學習可以輕松地將兩個數(shù)字都識別為9。深度學習準確地對不同對象進行分類的能力可以解決自動駕駛汽車面臨的一些主要挑戰(zhàn)。

2020-10-23 16:05:32

1291

深度學習與機器學習的區(qū)別是什么

隨著人工智能浪潮席卷現(xiàn)代社會，不少人對于機器學習、深度學習、計算機視覺、自然語言處理等名詞已經(jīng)耳熟能詳。可以預見的是，在未來的幾年里，無論是在業(yè)界還是學界，擁有深度學習和機器學習能力的企業(yè)都將扮演重要角色。

2021-02-02 10:56:32

9486

機器學習和深度學習有什么區(qū)別？

深度學習算法現(xiàn)在是圖像處理軟件庫的組成部分。在他們的幫助下，可以學習和訓練復雜的功能;但他們的應用也不是萬能的。 “機器學習”和“深度學習”有什么區(qū)別？在機器視覺和深度學習中，人類視覺的力量和對視

2021-03-12 16:11:00

7763

基于深度學習的疲勞駕駛檢測算法及模型

為實現(xiàn)復雜駕駛環(huán)境下駕駛人員疲勞狀態(tài)識別與預警，提出基于深度學習的疲勞駕駛檢測算法。利用基于 shuffle- channel思想的 MTCNN模型檢測常規(guī)攝像頭實時采集的駕駛人員人臉圖像

2021-03-30 09:17:55

基于深度學習的神經(jīng)協(xié)同過濾推薦系統(tǒng)

推薦系統(tǒng)是解決信息過載問題的核心。現(xiàn)有的推薦框架硏究面臨著顯弌反饋數(shù)據(jù)稀疏和數(shù)據(jù)預處理難等問題，特別是對新用戶和新項目進行推薦的性能有待進一步提高。隨著深度學習的推進，基于深度學習的推薦成為了當

2021-05-08 16:11:12

基于深度學習的機器人示教系統(tǒng)設計與實現(xiàn)

基于深度學習的機器人示教系統(tǒng)設計與實現(xiàn)

2021-06-30 15:53:37

深度學習嵌入式系統(tǒng)

2021-10-20 19:05:58

深度學習在工業(yè)自動化中的優(yōu)勢

作為人工智能（AI）的下一步，機器學習由系統(tǒng)定義，這些系統(tǒng)可以通過比標準計算機更少的人工交互來運行和處理。然后，深度學習又是機器學習的演變，機器學習指的是利用以人腦為模型的神經(jīng)網(wǎng)絡進行推斷的系統(tǒng)。

2022-03-23 09:48:55

1351

自動駕駛之眼--前視攝像頭系統(tǒng)深度解剖Ⅰ

自動駕駛之眼--前視攝像頭系統(tǒng)深度解剖Ⅰ

2022-10-28 12:00:07

集成智能傳感器健康監(jiān)測用于先進駕駛輔助系統(tǒng)和自主駕駛

集成智能傳感器健康監(jiān)測用于先進駕駛輔助系統(tǒng)和自主駕駛

2022-11-02 08:16:08

使用HPEC促進深度學習技術

　　期待已久的機器學習時代終于到來了。深度學習技術對作戰(zhàn)人員的潛在好處既巨大又深遠。隨著防御系統(tǒng)趨向于更大的應用程序自主性，深度學習技術過于復雜，無法用更傳統(tǒng)的處理技術實現(xiàn)，現(xiàn)在可以幫助顯著推動

2022-11-02 09:48:53

471

深度學習算法在自動駕駛規(guī)控中的應用解讀

雖然目前公開的自動駕駛規(guī)控算法相關資料大都是針對基于規(guī)則的算法的，但筆者打開招聘軟件卻經(jīng)常能看到自動駕駛企業(yè)招聘規(guī)控算法工程師時會要求候選人懂深度學習算法，這在某種程度上也說明了目前很多企業(yè)也正在向混合決策算法“進軍”。

2022-11-16 09:57:40

866

讀懂深度學習，走進“深度學習+”階段

人工智能的概念在1956年就被提出，如今終于走入現(xiàn)實，離不開一種名為“深度學習”的技術。深度學習的運作模式，如同一場傳話游戲。給神經(jīng)網(wǎng)絡輸入數(shù)據(jù)，對數(shù)據(jù)的特征進行描述，在神經(jīng)網(wǎng)絡中層層傳遞，最終

2023-01-14 23:34:43

588

實現(xiàn)自動駕駛需要我們重新思考人車交互

在這種自動駕駛水平下，確保駕駛員和自動駕駛系統(tǒng)之間的無縫交接是我們的目標。因此，行業(yè)需要一種與駕駛員進行交互的智能新系統(tǒng)一一它能夠構(gòu)建車內(nèi)外環(huán)境模型以及駕駛員狀態(tài)模型并將兩者相結(jié)合，保證駕駛員能夠順利接管車輛控制權。

2023-04-24 09:17:28

785

創(chuàng)新的車載手勢交互系統(tǒng)：駕駛員與汽車的智能互動

近年來，汽車行業(yè)逐漸向“智能化”、“電動化”、“互聯(lián)化”方向發(fā)展，而車載手勢交互系統(tǒng)作為連接駕駛員與汽車之間的關鍵樞紐，成為實現(xiàn)這一轉(zhuǎn)型的重要一環(huán)。車載手勢交互系統(tǒng)是指通過手勢動作來控制汽車的各種

2023-05-18 15:34:33

964

智造之眼丨深度學習應用

智造之眼?科學設計深度學習各應用流程，在盡量簡化前期準備工作的基礎上為客戶提供穩(wěn)定且準確的深度學習解決方案。

2023-05-04 16:55:52

424

AI、機器學習和深度學習的區(qū)別及應用

深度學習和神經(jīng)網(wǎng)絡的區(qū)別在于隱藏層的深度。一般來說，神經(jīng)網(wǎng)絡的隱藏層要比實現(xiàn)深度學習的系統(tǒng)淺得多，而深度學習的在隱藏層可以有很多層。

2023-07-28 10:44:27

296

深度學習算法簡介深度學習算法是什么深度學習算法有哪些

深度學習算法簡介深度學習算法是什么?深度學習算法有哪些?? 作為一種現(xiàn)代化、前沿化的技術，深度學習已經(jīng)在很多領域得到了廣泛的應用，其能夠不斷地從數(shù)據(jù)中提取最基本的特征，從而對大量的信息進行機器學習

2023-08-17 16:02:56

6000

深度學習是什么領域

等領域，以及交叉學科領域，如生物信息學、機器人技術和社會網(wǎng)絡分析。深度學習的基礎可以追溯到20世紀40年代，當時Hinton等人提出的神經(jīng)網(wǎng)絡理論為深度學習的提出奠定了基礎。然而，在那個時代，由于硬件和數(shù)據(jù)的限制，深度

2023-08-17 16:02:59

989

什么是深度學習算法？深度學習算法的應用

什么是深度學習算法？深度學習算法的應用深度學習算法被認為是人工智能的核心，它是一種模仿人類大腦神經(jīng)元的計算模型。深度學習是機器學習的一種變體，主要通過變換各種架構(gòu)來對大量數(shù)據(jù)進行學習以及分類處理

2023-08-17 16:03:04

1300

深度學習框架是什么？深度學習框架有哪些？

深度學習框架是什么？深度學習框架有哪些？? 深度學習框架是一種軟件工具，它可以幫助開發(fā)者輕松快速地構(gòu)建和訓練深度神經(jīng)網(wǎng)絡模型。與手動編寫代碼相比，深度學習框架可以大大減少開發(fā)和調(diào)試的時間和精力，并提

2023-08-17 16:03:09

1586

深度學習框架和深度學習算法教程

深度學習框架和深度學習算法教程深度學習是機器學習領域中的一個重要分支，多年來深度學習一直在各個領域的應用中發(fā)揮著極其重要的作用，成為了人工智能技術的重要組成部分。許多深度學習算法和框架提供

2023-08-17 16:11:26

637

機器學習和深度學習的區(qū)別

　　機器學習和深度學習是當今最流行的人工智能(AI)技術之一。這兩種技術都有助于在不需要人類干預的情況下讓計算機自主學習和改進預測模型。本文將探討機器學習和深度學習的概念以及二者之間的區(qū)別。

2023-08-28 17:31:09

887

深度學習的由來深度學習的經(jīng)典算法有哪些

深度學習作為機器學習的一個分支，其學習方法可以分為監(jiān)督學習和無監(jiān)督學習。兩種方法都具有其獨特的學習模型：多層感知機、卷積神經(jīng)網(wǎng)絡等屬于監(jiān) 督學習；深度置信網(wǎng) 、自動編碼器、去噪自動編碼器、稀疏編碼等屬于無監(jiān)督學習。

2023-10-09 10:23:42

301

深度學習在語音識別中的應用及挑戰(zhàn)

的挑戰(zhàn)。二、深度學習在語音識別中的應用 1.基于深度神經(jīng)網(wǎng)絡的語音識別：深度神經(jīng)網(wǎng)絡（DNN）和循環(huán)神經(jīng)網(wǎng)絡（RNN）是深度學習在語音識別中應用的主要技術。基于這些網(wǎng)絡的語音識別系統(tǒng)能夠有效地提高識別精度和效率，并且被廣

2023-10-10 18:14:53

447

為什么深度學習的效果更好？

導讀深度學習是機器學習的一個子集，已成為人工智能領域的一項變革性技術，在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度學習的有效性并非偶然，而是植根于幾個基本原則和進步

2024-03-09 08:26:27

已全部加載完成

搜索歷史

基于深度學習的自主駕駛系統(tǒng)社會交互思考

評論