吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用對抗性深度強化學習來衡量自動駕駛汽車的運動規劃和碰撞避免機制的可靠性

ml8z_IV_Technol ? 來源:未知 ? 作者:李倩 ? 2018-06-08 09:54 ? 次閱讀

現如今,隨著人工智能技術的迅速發展,人們普遍認為,未來的交通系統將由自動駕駛汽車(AV)所主導。可以說,對于更為安全的交通設施的需求是引起人們對自動駕駛汽車感興趣并推動其發展的一個主要推動力。但不可否認,就現在而言,可靠和具有魯棒性的自動駕駛汽車技術的發展仍然是一個持續的挑戰,對可靠的運動規劃和碰撞避免機制的研究尤其重要。最近,堪薩斯州立大學(Kansas State University,KSU)的科學家了提出了一種基于深度強化學習的新框架,用于對自動駕駛汽車的碰撞避免機制的行為進行基準測試。

現如今,隨著人們對自主導航的興趣日益增長,關于運動規劃和碰撞避免技術(collision avoidance techniques)的研究已經加速了全新提議和新進展的速度。然而,新技術的復雜性及其安全性要求使得當前的大部分基準測試框架不充分,因此對高效的比較技術的需求沒有得到滿足。這項研究提出了一種基于深度強化學習的新框架,用于在處理最佳對抗性智能體的最壞情況下對碰撞避免機制的行為進行基準測試,該最佳對抗性智能體進行訓練從而將系統驅動到不安全狀態。我們將這個框架的體系結構和流程描述為一個基準測試解決方案,并通過一個比較兩種碰撞避免機制的可靠性的實際案例研究來證明其有效性,從而對有意識的碰撞嘗試做出回應。

人們普遍認為,未來的交通系統將由自動駕駛汽車(AV)所主導。隨著近年來這一領域的迅速發展,許多人預測這種轉變將在未來十年內發生。對更為安全的交通運輸的需求,是引起人們興趣和推動自動駕駛汽車發展的一個主要動機。一般認為,用專家計算模型代替人類駕駛員的內在缺陷,可以顯著減少由駕駛員的誤差所導致的事故數量。然而,可靠和具有魯棒性的自動駕駛汽車技術的發展仍然是一個持續的挑戰,并且人們正在積極從各個研究和發展方向來追求這一目標。

圖1:對抗性目標的圖釋

對可靠的運動規劃和碰撞避免機制的研究尤其重要。在過去數十年的時間里,科學家們已經提出了許多解決這個問題的方法,從控制理論形式化和最優控制方法到潛在的基于場和規則的技術(field- and rule-based techniques),等等。最近,機器學習的進步使得基于諸如模仿學習和深度強化學習(RL)等技術的全新數據驅動的碰撞避免方法成為可能。然而,隨著其部署環境和機制日益復雜,為這些解決方案提供安全保障的挑戰變得越來越困難。一個值得注意的例子是交通碰撞避免系統(TCAS),在它廣泛部署到NextGen商用飛機之前,它就已經滿足了聯邦航空局(FAA)的嚴格安全要求。然而,最近的一些表現表明它在現代高密度空域中非常不可靠,在一定程度上,它可能會導致不可避免的碰撞狀態(ICS)——不管未來的軌跡如何,最終都會發生碰撞。此外,最近的研究表明,自動感知和避免機制可以被對抗性地加以利用以操縱自動駕駛車輛的運動軌跡。

作為回應,科學家們提出了越來越多的緩解技術和全新的安全運動規劃方法,但每一種都有特定的特定于案例的假設和驗證程序。因此,對這些方法進行定量比較變得非常困難。當前最為先進的方法包括在運動規劃和碰撞避免中對安全行為進行基準測試的幾次嘗試,但是許多現有的框架未能滿足基于機器學習的新自適應技術的要求。而且,目前的基準測試框架并不能提供全面的和具有魯棒性的探測機制,用于在不理想狀態和軌跡的復雜空間中進行探索。這種框架中的突出方法是基于隨機化或基于情景的障礙產生,這些障礙很容易丟失特定于被測機制的關鍵ICS或其他不需要的狀態。這些框架中的另一種方法依賴于計算上昂貴的碰撞狀態可達性分析技術,而這也無法為安全運行的關鍵邊界提供具體的保證。

圖2:實驗環境設置

為了彌補以安全為中心的基準測試的缺陷,本文提出了一種基于機器學習的新框架,用于在與最優對抗性智能體進行交互的最壞情況下對新技術的可靠性進行基準測試。該框架采用深度強化學習的強大的探索和優化性能來訓練對抗性自主智能體,而該智能體的目標是學習旨在將系統驅動到ICS和其他不安全狀態的最佳導航策略。根據分析的參數和目標,這些目標可能包括對抗性智能體與自動駕駛汽車的直接碰撞,或利用避免碰撞機制來操縱自動駕駛汽車的軌跡以改變和控制其路徑,或間接誘發自動駕駛汽車和環境中的其他物體之間的碰撞。

在此基礎上,這項研究的主要貢獻包括:

1)提出碰撞避免算法的最壞情況基準測試的計算框架和處理流程,且獨立于其復雜性、隨機性以及自適應動力學。

2)提出深度強化學習過程流程以無縫地適應于被測系統,并克服完全隨機或基于情景的探索機制的缺點。

3)提出關于碰撞避免算法標準化比較的全新的衡量指標。

4)通過一個比較兩種碰撞避免機制應對故意碰撞企圖的可靠性的實際案例研究,來證明所提出框架的實際應用和效果。

圖3:實驗結果——平均超過100次運行

總而言之,在本文中,我們提出了一個流程和框架,它利用對抗性深度強化學習來衡量自動駕駛汽車的運動規劃和碰撞避免機制的可靠性。我們已經確立了這一框架的優勢,要超過當前的基準測試規劃,其中包括靈活性和通用性、通過針對特定系統下測試、樣本效率和自定義探索機制對對抗性策略進行訓練獲得的適用性探測,以及為不同系統之間的基準測試和比較提供基線(例如,最壞的情況)測量。

可以這樣說,本文所提出框架的直接架構為進一步研究提供了一些潛在的研究領域。緊隨而來的下一個步驟就是將此框架應用于顯著的和最近發布的運動規劃和碰撞避免技術中,目的是為相關研究項目創建參考基準。另一個有發展前景的研究領域是檢查近期發布技術的適用性,這些已發布的技術聲稱在對抗性干擾下進行訓練可以增強策略的適應力和魯棒性。因此,通過對對抗性策略和碰撞避免的強化學習模型的結合性訓練進行調查,可能會出現潛在的緩解和防御技術。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47683

    瀏覽量

    240336
  • 自動駕駛
    +關注

    關注

    785

    文章

    13932

    瀏覽量

    167017

原文標題:對抗強化學習最新研究:可用于自動駕駛汽車「碰撞避免機制」檢測

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一個使用傳統DAS和深度強化學習融合的自動駕駛框架

    本文提出了一個使用傳統DAS和深度強化學習融合的自動駕駛框架。該框架在DAS功能(例如車道變換,巡航控制和車道保持等)下,以最大限度地提高平均速度和最少車道變化為規則,確定超車次數。
    的頭像 發表于 06-14 09:41 ?8971次閱讀

    什么是深度強化學習?深度強化學習算法應用分析

    什么是深度強化學習? 眾所周知,人類擅長解決各種挑戰的問題,從低級的運動控制(如:步行、跑步、打網球)到高級的認知任務。
    發表于 07-01 10:29 ?1528次閱讀
    什么是<b class='flag-5'>深度</b><b class='flag-5'>強化學習</b>?<b class='flag-5'>深度</b><b class='flag-5'>強化學習</b>算法應用分析

    FPGA在自動駕駛領域有哪些應用?

    低,適合用于實現高效的圖像算法,如車道線檢測、交通標志識別等。 雷達和LiDAR處理:自動駕駛汽車通常會使用雷達和LiDAR(激光雷達)等多種傳感器獲取環境信息。FPGA能夠協助完成這些傳感器
    發表于 07-29 17:09

    AI/自動駕駛領域的巔峰會議—國際AI自動駕駛高峰論壇

    已經滲透到了社會生活的方方面面。人工智能在自動駕駛領域將對整個汽車出行領域產生顛覆變革。汽車的人工智能技術和數據后端的最新突破使自動駕駛
    發表于 09-13 13:59

    人工智能深度學習發展迅速,智能科技公司都已經涉足人工智能產品的研發!

    深度學習(Deep Learning)核心技術開發與應用1,Deep Learning—循環神經網絡2,Deep Learning—CNN應用案例3,Deep Learning—對抗性生成網絡4
    發表于 09-05 10:22

    如何讓自動駕駛更加安全?

    要有可靠性、安全做保證。現在一些企業往往以市場推廣宣傳為主,真正技術上能達到安全可靠的還是比較少。實現真正意義上的自動駕駛是個系統工程需要汽車
    發表于 05-13 00:26

    深度學習DeepLearning實戰

    內容2:課程一: Tensorflow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實現:1、卷積神經網絡CNN2、循環神經網絡RNN3、強化學習DRL4、對抗性生成
    發表于 01-09 17:01

    深度強化學習實戰

    內容2:課程一: TensoRFlow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實現:1、卷積神經網絡CNN2、循環神經網絡RNN3、強化學習DRL4、對抗性生成
    發表于 01-10 13:42

    存儲如何提升自動駕駛汽車可靠性看了就知道

    更智能的存儲如何提升自動駕駛汽車可靠性
    發表于 03-10 07:01

    基于強化學習的飛行自動駕駛儀設計

    針對強化學習在連續狀態連續動作空間中的維度災難問題,利用BP神經網絡算法作為值函數逼近策略,設計了自動駕駛儀。并引入動作池機制,有效避免飛行
    發表于 06-25 16:27 ?27次下載
    基于<b class='flag-5'>強化學習</b>的飛行<b class='flag-5'>自動駕駛</b>儀設計

    強化學習自動駕駛的應用

    自動駕駛汽車首先是人工智能問題,而強化學習是機器學習的一個重要分支,是多學科多領域交叉的一個產物。今天人工智能頭條給大家介紹強化學習
    的頭像 發表于 07-10 09:00 ?5033次閱讀
    <b class='flag-5'>強化學習</b>在<b class='flag-5'>自動駕駛</b>的應用

    探討深度學習自動駕駛中的應用

    深度強化學習的理論、自動駕駛技術的現狀以及問題、深度強化學習自動駕駛技術當中的應用及基于
    的頭像 發表于 08-18 10:19 ?5219次閱讀

    深度學習技術與自動駕駛設計的結合

    在過去的十年里,自動駕駛汽車技術取得了越來越快的進步,主要得益于深度學習和人工智能領域的進步。作者就自動駕駛中使用的
    發表于 10-28 16:07 ?2058次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>技術與<b class='flag-5'>自動駕駛</b>設計的結合

    強化學習與智能駕駛決策規劃

    本文介紹了強化學習與智能駕駛決策規劃。智能駕駛中的決策規劃模塊負責將感知模塊所得到的環境信息轉化成具體的
    的頭像 發表于 02-08 14:05 ?1934次閱讀

    鑒源實驗室·如何通過雷達攻擊自動駕駛汽車-針對點云識別模型的對抗性攻擊的科普

    非常精確,它們也面臨一種新興的威脅——對抗性攻擊。 對抗性攻擊是一種通過微小但精心設計的擾動,旨在欺騙機器學習模型的攻擊方式。對于自動駕駛系統而言,這意味著通過對傳感器輸入的數據進行極
    的頭像 發表于 11-05 15:44 ?366次閱讀
    鑒源實驗室·如何通過雷達攻擊<b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>-針對點云識別模型的<b class='flag-5'>對抗性</b>攻擊的科普
    百家乐官网娱乐城体验金| 大发888吧| 利高百家乐娱乐城| 百家乐官网赌博赌博网站| 百乐门娱乐城| 晓游棋牌官方下载| 大发888手机版下载官方网站| 免费百家乐过滤软件| 百家乐7scs娱乐网| 百家乐保单破解方法| 澳门百家乐代理| 百家乐全讯网2| 百家乐的嬴钱法| 精英百家乐现金网| 百家乐庄河闲的赌法| 百家乐注册下注平台| 澳门百家乐赌客| 百家乐庄闲赢负表| 蓝盾百家乐打法| 百家乐龙虎扑克牌游戏技巧打| 百家乐注册18元体验金| 荷规则百家乐的玩法技巧和规则 | 美高梅百家乐官网娱乐城| 天猫国际娱乐城| 罗马百家乐官网娱乐城| 澳门百家乐官网娱乐注册| 百家乐官网开户最快的平台是哪家 | 本溪棋牌娱乐网| e世博备用网址| 超级皇冠网分布图| 南靖县| 百家乐官网技巧之微笑心法| 百家乐官网平注常赢法| 百家乐官网博娱乐平台赌百家乐官网| 风水罗盘里的24山| 试玩百家乐网| 百家乐投注| 伟德亚洲娱乐城| 大东方娱乐城| 百家乐官网封号| 龙博百家乐官网的玩法技巧和规则|