《上海交通大學學報》—基于深度強化學習的區域化視覺導航方法

基于深度強化學習的區域化視覺導航方法

本文來自《上海交通大學學報》，作者李鵬等

關注微信公眾號：人工智能技術與咨詢。了解更多咨詢！
?

在環境中高效導航是智能行為的基礎,也是機器人控制領域研究的熱點之一.實現自主導航的傳統方法是結合一系列硬件和算法解決同步定位和建圖、路徑規劃及動作控制等問題,該類方法在實際應用中取得了良好效果,但需人工設計特征和預先構造地圖[1].通過對空間認知行為的研究,動物神經學家發現,哺乳動物可基于視覺輸入和環境信息(食物、巢穴、配偶等)在海馬體內形成認知地圖[2],從而實現大范圍導航.在探索環境過程中,端到端的學習方法可建立視覺到動作的直接映射,使得動作不會與視覺信息分離,而是在一起相互學習,以此獲得與任務相關的空間表征.近年來備受關注的深度強化學習[3]具有類似的學習方法,可通過構建表征完成具有挑戰性的導航任務.

當機器人與環境交互時,導航被看作一個尋優過程[4],而隨著深度模型的發展和異步優勢訓練方法的應用,深度強化學習在導航領域展現出強大的生命力.Zhu等[5]將預先訓練好的ResNet與Actor-Critic(AC)算法結合,并在根據實際場景設計的3D仿真環境下進行測試,實現了目標驅動的視覺導航,同時證明該方法具有更好的目標泛化能力.Mirowski[4]等提出Nav A3C模型,且在訓練過程中增加深度預測和閉環檢測任務,使得在同樣訓練數據下可兩次更新網絡參數.Jaderberg等[6]則研究了關于非監督輔助任務對訓練的影響,這兩種方法為提升導航性能提供了新的思路.為適應大比例地圖,Oh等[7]在探索過程中將重要環境信息存儲在外部記憶體中,待需要時再進行調用,但當處于非常大或終身學習場景中時,該系統的內存容量會隨探索周期的持續而線性增長.面對這種情況,可考慮通過分割環境緩解模型記憶壓力,類似的區域劃分方法已在多個領域發揮作用.黃健等[8]在標準粒子群算法的基礎上加入區域劃分方法,針對不同區域的粒子采用不同策略自適應調整粒子的慣性權重和學習因子,達到尋優與收斂的平衡,降低了由聲速不確定性引發的水下定位誤差.張俊等[9]將邊指針和區域劃分結合,提高了大規模數據處理效率.Ruan等[10]則利用局部區域提高了數據關聯準確性.在醫學研究中,區域劃分是研究腦片圖像中不同腦區分子表達、細胞數目及神經網絡連接模式量化和比較的基礎[11],而在航空運輸領域,區域劃分更是與航線規劃密切相關.同樣,在利用深度強化學習實現導航的方法中,也有涉及區域劃分的研究.Kulkarni等[12]在框架中應用繼承表征(SR)實現深度繼承強化學習(DSR),并在兩個簡單的導航任務中進行實驗.與深度Q網絡(DQN)[13]相比,DSR能更快適應末端獎勵值變化,且對于多區域環境可進行子目標提取.Shih等[14]提出一種分布式深度強化學習模型,可用于室內不同區域間的導航.Tessler等[15]模仿動物學習方式提出一種終身學習模型,在模型中可重復使用和同化其他任務中學習到的技巧,其中就包括某一環境下的導航策略,通過技巧之間的組合,可實現區域間導航.

本文研究在終身學習模型的基礎上展開,面對分布式環境,不再使用單一模型在整個環境中導航,而是利用子模塊在各區域內獨立學習控制策略,并通過區域化模型集成控制策略實現大范圍導航.與此同時,在訓練方法上做出兩點改進:① 在子模塊中增加獎勵預測任務,緩解導航任務固有的獎勵稀疏性,構建對獎勵敏感的空間表征.② 在原有探索策略基礎上結合深度信息躲避障礙物,防止遍歷停滯.實驗在第一人稱視角的3D環境下進行.

1 深度強化學習簡介

深度強化學習是深度學習和強化學習的結合,利用深度學習可自動抽象高維數據(圖像、文本、音頻等)的特性,解決了強化學習由于內存、計算及樣本復雜度等引發的維數災難問題,這給人工智能領域帶來了革命性的變化,預示對視覺世界具有更高層次理解的端到端系統的建立.其中,典型架構為深度Q網絡[13]及深度遞歸Q網絡[16].

1.1 深度Q網絡

深度Q網絡是第一個被證明的可以在多種環境中直接通過視覺輸入學習控制策略的強化學習算法,其模型如圖1所示,其輸入是4個連續串聯的狀態幀.

圖1?? DQN模型
?

Fig.1?? DQN model
?

標準的強化學習通過與環境交互實現,在每一個時間步t,智能體會根據當前環境狀態st和策略π選擇一個動作at,在執行動作以后,將獲得一個獎勵信號rt,并進入下一狀態st+1.定義Rt為每一個時間步的累積折扣獎勵:

Rt=?[Math Processing Error]∑t'=tTγt'-trt'

(1)

式中:T為回合的最大步數;γ∈[0, 1]為折扣因子;t'為下一時間步;rt'為下一時間步的獎勵.DQN使用動作值函數學習控制策略,在給定策略π的情況下,動作值函數Qπ定義為狀態s下執行動作a后的期望回報:

Qπ(s,?a)=E[Rt|st=s,?at=a]

(2)

在定義Qπ的同時定義最優動作值函數Q*,即Q*(s,?a)=?[Math Processing Error]maxπQπ(s,?a),借助貝爾曼方程可迭代更新動作值函數:

Qi+1(s,?a)=Es'[r+γ[Math Processing Error]maxa'Qi(s',?a')]

(3)

式中:s'及a'分別為下一時間步的狀態和動作.當i→∞時,Qi→Q*.DQN使用一個參數為θ的深度卷積神經網絡擬合Q值,此時同樣可以利用貝爾曼等式更新參數θ,定義均方誤差損失函數:

Lt(θt)=Es,a,r,s'[(yt-?[Math Processing Error]Qθt(s,?a))2]

(4)

式中:yt=r+γ[Math Processing Error]maxa'[Math Processing Error]Qθt(s',?a')代表目標,通過微分損失函數可得梯度更新值:

[Math Processing Error]ΔθtLt(θt)=Es,a,r,s'[(yt-?[Math Processing Error]Qθt(s,a))?[Math Processing Error]ΔθtQθt(s,?a)]

(5)

通過在環境中學習不斷減小損失函數,使得Q(s,?a;θ)≈Q*(s,?a).其實DQN并不是第一個嘗試利用神經網絡實現強化學習的模型,它的前身是神經擬合Q迭代(NFQ)[17],并且DQN架構與Lange等[18]提出的模型密切相關,而DQN之所以能達到與專業游戲測試人員相當的分數,是因為應用了兩種關鍵改進:① 目標網絡,與標準的Q-learning相比,這種方法使用一組參數滯后的網絡生成目標,可在更新Q(st,?at)和yt的時間點之間增加延遲,從而降低策略發散或振蕩的可能性.② 經驗回放,這是一種受生物學啟發的機制,通過對經驗池中樣本均勻采樣,可有效打破數據的時間相關性,同時平滑數據分布.從訓練角度看,經驗池的使用可大大減少與環境所需的交互量,并且能夠提高批量數據吞吐量.目標網絡和經驗回放在隨后的深度強化學習方法中也得到了應用和發展[19].

1.2 深度遞歸Q網絡

DQN已被證明能夠從原始屏幕像素輸入學習人類級別的控制策略,正如其名字一樣,DQN根據狀態中每一個可能動作的Q值(或回報)選擇動作,在Q值估計足夠準確的情況下,可通過在每個時間步選擇Q值最大的動作獲取最優策略.然而,由1.1節可知,DQN的輸入是由智能體遇到的4個狀態組成的,這種從有限狀態學習的映射,本身也是有限的,因此,它無法掌握那些要求玩家記住比過去4個狀態更遠事件的游戲.換句話說,任何需要超過4幀內存的游戲都不會出現馬爾可夫式,此時游戲不再是一個馬爾可夫決策過程(MDP),而是一個部分可見的馬爾可夫決策過程(POMDP)[20].當使用DQN在POMDP中學習控制策略時,DQN的性能會有所下降,因為在狀態部分可觀察的情況下,智能體需記住以前的狀態才能選擇最優動作.為此,Hausknecht等[16]將具有記憶功能的長短時記憶網絡(LSTM)[21]與DQN結合,提出深度遞歸Q網絡(DRQN),其模型如圖2所示.

圖2?? DRQN模型
?

Fig.2?? DRQN model
?

為隔離遞歸性影響,對DQN結構進行最小程度修改,只將DQN中第一個全連接層替換為相同大小的LSTM層,使LSTM輕易與DQN結合.實驗中設計了多種環境測試DRQN處理部分可觀測狀態的效果:① 當使用完整觀察狀態進行訓練并使用部分觀察狀態進行評估時,DRQN可更好地應對信息丟失帶來的影響.② 在每個時間步只有一個狀態幀輸入時,DRQN 仍可跨幀集成信息學習控制策略.

2 區域化導航方法

基于對分布式環境的分析,以深度強化學習為基礎,在各區域內學習控制策略,同時通過區域化模型結合控制策略完成復雜環境下的導航任務.在學習過程中,為提高訓練效率及導航性能,在子模塊中增加獎勵預測任務,并結合深度信息躲避障礙物.

2.1 景深避障

高效探索未知環境是導航的基礎,以哺乳動物為例,當將其置于一個陌生環境時,它會根據環境中的顏色、氣味及光照等特征快速遍歷空間,以便于后續的目的性行為.在設計機器人探索策略時,同樣力求高效遍歷狀態空間,并盡量減少與障礙物碰撞,但由于傳感器限制,機器人并不能獲得如此多的環境信息,因此在探索起始階段需使用啟發式的探索策略,并結合硬件輔助完成遍歷過程.比較典型的探索方案是DQN以及DRQN所使用的ε-greedy[12,?15]策略,該策略在每一個時間步t選擇動作at的方法如下式所示:

at=?[Math Processing Error]random(at∈A),εargmaxa∈AQ(st,a),1-ε

(6)

其中,ε在探索開始時設置為1,并隨探索步數的增加線性減少,最后固定為一個比較小的值.在訓練階段,機器人主要通過視覺信息在區域內自主學習.因此,當撞到障礙物時,如果此時沒有較好的避障措施,那么將長時間停留在一個地點.為了防止遍歷停滯,提高探索效率,本文在ε-greedy探索策略基礎上,結合狀態深度信息為探索動作添加限制,單個回合的探索流程如圖3所示.

圖3?? 探索流程

Fig.3?? Exploration process

從流程圖可以看出,景深避障需在執行動作之前完成,即當機器人獲取視覺信息后,并不立即使用視覺信息選取動作,而是先通過狀態深度圖中的最小值與閾值相比較,在判斷是否撞到障礙物后再執行下一步動作.

2.2 獎勵預測

在學習導航策略過程中,機器人需識別出具有高回報或高獎勵的狀態,以便于更高效地學習值函數和策略.然而,環境中的獎勵往往是稀疏分布的,目標也只有一個,這就提出一個問題:在不包含獎勵的狀態下,智能體應通過什么學習以及如何學習.

其實除獎勵外,環境中還包含大量可以用來學習的目標,例如當前或后續幀中的某些特征,傳統的無監督學習就是通過重建這些特征實現加速學習的.相反,在輔助任務[6]中,機器人的目標是預測和控制環境中的特征,并把它們當作強化學習中的偽獎勵,在缺少獎勵的情況下進行學習.在狀態空間中,獎勵一般代表環境中的長期目標,而偽獎勵代表環境中的短期目標,當偽獎勵的目標與獎勵的目標緊密相關時,將有助于形成對目標敏感的空間表征.導航的目標是最大化獎勵,為緩解獎勵稀疏性和促進表征學習,在區域導航子模塊中增加獎勵預測任務,其模型如圖4所示.

圖4?? 獎勵預測模型

Fig.4?? Reward prediction model

模型中通過前饋網絡連接被卷積編碼的狀態實現獎勵預測,其中有兩點值得注意:① 獎勵預測主要針對感知環境的卷積部分進行優化,除用于獲取對獎勵敏感的表征外,不會影響控制策略的學習,所以獎勵預測使用與動作選取不同的體系結構.② 在模型訓練方面,雖然獎勵預測與動作選取同步更新,但前者沒有使用在線學習方法,而是利用經驗池更新.在訓練過程中,獎勵預測需通過3幀連續序列Sτ={sτ-3,?sτ-2,?sτ-1}預測在隨后觀測中的獎勵rτ,但不要求其給出具體數值,所用損失函數為交叉熵分類:

LRP=-?[Math Processing Error]rτlgr^τ+(1-rτ)lg(1-r^τ)

(7)

式中:?[Math Processing Error]r^τ為預測值.此外,為提高表征構建效率,不再使用隨機方式采樣訓練樣本,而是以P=0.5的概率從經驗池中抽取包含獎勵的序列,經驗池中數據也會隨策略π產生的數據更新.

2.3 區域化導航模型

哺乳動物具有非凡的空間探索和創造能力,通過感知不斷變化的環境可準確地回到幾百米,甚至上千米以外的巢穴,但對于移動機器人,隨著狀態和動作空間的擴張,導航性能會隨之下降,特別是當面對具有多區域特性的大比例環境時,往往會陷入無限探索困境.受終身學習模型啟發,本文提出一種區域化導航方法,面對分布式環境,該方法使用單獨的子模塊在各區域內學習控制策略,模塊結構如圖5所示,圖中價值函數Vπ定義為在給定策略π的情況下以狀態s為起點的期望回報:

[Math Processing Error]Vmπ(s)=ERt|st=s

(8)

圖5?? 區域導航子模塊

Fig.5?? Submodule of region navigation

式中:m為區域編號.模塊中包括動作選取和獎勵預測兩部分.在整個學習過程中,動作選取和獎勵預測既相互獨立又相輔相成,它們會按照各自的方式更新參數:動作選取部分通過與環境交互不斷優化導航策略,獎勵預測部分則利用經驗池中的數據構建表征.同時它們又相互聯系:當執行更優導航策略后,經驗池中包含獎勵的狀態會增多,有助于形成對獎勵敏感的表征,而表征會以參數共享的方式傳遞到動作選取部分,進一步提升導航性能.

當所有區域控制策略訓練完成時,按照收斂的先后順序將策略集成到模型內部,模型中的每一層代表一個區域的控制策略.環境控制策略由相同的子模塊在整個環境中學習獲得,主要起中繼作用,因此不要求其收斂,當所有區域策略收斂后,環境控制策略也停止訓練,并以當前參數集成到模型中.本文策略選取的方法是基于動作Q值實現的,為更好地分辨區域,不再使用單一觀測選取策略,而是綜合考慮機器人在環境中某一位置前后左右4個方向的觀測值:

Qv=?[Math Processing Error]Q(s,a)+Q90(s,a)+Q180(s,a)+Q270(s,a)4

(9)

式中:Qv為動作均值;Q(s,?a)、Q90(s,?a)、Q180(s,?a)及Q270(s,?a)為機器人在起始位置每向右旋轉90°?度所選動作的Q值.同時定義?[Math Processing Error]Qv0,用于表示環境控制策略的動作均值,([Math Processing Error]Qv1,?[Math Processing Error]Qv2, …,?[Math Processing Error]QvN)用于表示各區域控制策略的動作均值.計算出的各策略動作均值存儲在緩沖區,在結合最大值函數后,可選出擁有最大動作均值的控制策略:

[Math Processing Error]I=max{Qv0,Qv1,…,QvN}

(10)

式中:I為最優策略編號.如果此時選取的是某一區域的控制策略,那么執行該策略直到區域內目標,然后將策略選取權交回.如果此時選取的是環境控制策略,只執行單步動作就將策略選取權交回,其流程如圖6所示.

圖6?? 多區域導航流程

Fig.6?? Multi-area navigation process

3 實驗結果與分析

3.1 實驗環境及參數設置

實驗在第一人稱3D游戲平臺DeepMind Lab[22]內進行,在實驗過程中,仿真環境以60幀/s的速度運行,部分運行畫面如圖7所示.動作空間是離散的,但允許細微控制,智能體可執行向前、向后或側向加速,并以小幅度增量旋轉.獎勵通過在環境到達目標獲得,每次接觸目標后,智能體都將被隨機重置到一個新的起點,同時開始下一輪探索.構建測試環境如圖8所示,其中包括單區域和多區域環境.在每個單區域環境中,包含1個目標(+10)和4個促進探索的稀疏獎勵(蘋果,+1).

圖7?? 仿真環境運行畫面

Fig.7?? Running screens of simulation environment
?

圖8?? 測試環境

Fig.8?? Test environment

區域導航子模塊結構已在2.3節給出,在該模塊中使用具有遺忘門的LSTM[23],除接受卷積編碼的狀態外,LSTM還融合上一時間步的動作和獎勵信息,策略和值函數可由LSTM輸出線性預測所得.卷積層和全連接層后緊接ReLU非線性單元,卷積層濾波器數量、尺寸、跨度以及全連接層和LSTM層參數如表1所示.學習過程中使用8線程異步優勢演員評論(A3C)方法[24]優化參數,ε在探索環境的前106步由1線性降低到0.1,并固定為0.1,學習率從[10-4,5×10-3]區間內按對數均勻分布取樣,折扣因子γ=0.99.機器人學習導航的過程主要以獎勵分值-時間(S-t)圖呈現,獎勵為1 h內(虛擬時間)機器人所獲獎勵與完成回合數的平均值,每個回合機器人執行 4500 步動作.

表1?? 神經網絡參數

Tab.1? Neural network parameters

網絡部分	動作選取	獎勵預測
卷積層1	16, 8, 4	16, 8, 4
卷積層2	32, 4, 2	32, 4, 2
全連接層	256	128
LSTM	256	無

3.2 訓練方法實驗

3.2.1 景深避障實驗在結合深度信息探索環境時,需預先設定碰撞閾值,所以在實驗過程中首先研究不同約束值對訓練的影響,然后對比使用不同深度信息探索環境的方法.在測試景深避障過程中只執行導航子模塊中的動作選取部分,不執行獎勵預測部分,實驗在3個單區域環境中進行.

使用不同約束值避障實驗結果如圖9所示,數據為3個單區域平均所得.由圖9可知,當閾值取?[Math Processing Error]0,3區間內不同值時,機器人探索效率和學習效果也各不相同.如果閾值設置為0,也就是只有在機器人撞到障礙物后才給予懲罰,會導致探索效率低下.而當閾值較大時,機器人將過早執行避障措施,間接干擾了導航動作,致使需要更多步數才能獲取獎勵.當閾值為1或2時,機器人既能有效避障,又可維持較高獎勵的導航行為,但由于閾值為2時控制策略缺乏穩定性,因此文中閾值設定為1.

圖9?? 不同閾值實驗結果

Fig.9?? Experiment results of different thresholds

結合不同深度信息探索環境的實驗結果如圖10所示,其中Nav A3C+D2參考文獻[4],深度圖認知參考文獻[25].由圖10可知,Nav A3C+D2通過預測環境深度信息,高效利用學習樣本,可在短時間內掌握控制策略,但該模型中包含兩層LSTM且結合深度預測任務,訓練過程中需消耗更多計算量.而深度圖認知以環境深度信息作為輸入,易于形成景深趨向的控制策略,可高效探索未知環境,但只利用深度信息,忽略了環境的顏色特征,導致機器人無法進一步理解環境.景深避障則是利用深度信息作為碰撞判別依據,使機器人在探索環境過程中有效避障,且不會給訓練帶來額外負擔,不過對目標導向行為沒有實質性的幫助,這也是本文后續增加獎勵預測的原因.

圖10?? 探索方法實驗結果

Fig.10?? Experiment results of exploration method

3.2.2 獎勵預測實驗在獎勵預測任務中,要求機器人在給定連續3幀的情況下,預測在隨后不可見幀中的獎勵,但無需預測獎勵的具體數值,只需給出有無獎勵即可.同時,使用經驗池抽取樣本,忽略原始數據中獎勵序列的概率分布,以更高的概率抽取獎勵事件.實驗在單區域環境中進行,在測試獎勵預測過程中不使用景深避障,實驗結果如圖11所示.由圖11可知,在增加獎勵預測后,機器人可在相同時間內,學習到更高獎勵的導航策略,并在一定程度上穩定學習過程.

圖11?? 獎勵預測實驗結果

Fig.11?? Experiment results of reward prediction

為進一步證明獎勵預測對空間表征的影響,抽取[4×106,5×106] h區間內的一個動作序列構建價值函數-時間圖(v-t圖),其結果如圖12所示.由圖12可知,在首次找到目標后,具有獎勵預測的機器人可在隨后的探索中以更少的動作再次到達目標,從而提高單個回合內所獲獎勵.由此可知,共享卷積層對模型性能起著決定性作用,同時訓練動作選取和獎勵預測,可使卷積層內核捕捉到獎勵的相關信息,并將包含獎勵存在和位置的特征給予LSTM,形成對獎勵敏感的空間表征,促進目標導向的控制策略.

圖12?? 價值函數-時間圖

Fig.12?? Value functions versus time

3.3 區域導航實驗

3.3.1 單區域導航實驗為驗證區域化模型在分布式環境中的性能,分別在單區域及多區域環境中進行測試.在單區域環境中,并不涉及策略的切換與結合,因此只使用區域導航子模塊在環境中學習控制策略,并使用Nav A3C+D2和終身學習模型中的深度技巧模塊進行對比.

單區域環境導航實驗結果如圖13所示,由圖13可知,由于本身以DQN模型為基礎,深度技巧模塊難以適應部分可見環境,在所有單區域環境中均表現出學習時間長,所獲獎勵少的缺陷.而在結合景深避障和獎勵預測后,區域導航子模塊在單區域1和單區域3中展現出與Nav A3C+D2類似的學習能力,但在單區域2內,由于環境特性,Nav A3C+D2具有更好的控制策略.

圖13?? 單區域導航實驗結果

Fig.13?? Experiment result of single-area navigation

3.3.2 多區域導航實驗多區域環境由單區域環境組合而成,圖8(d)中包含兩個區域,圖8(e)中包含3個區域.在訓練過程中,無論環境中包含幾個區域,區域化模型和終身學習模型都會根據人工劃分的區域分配相應的子模塊在各區域內獨立學習,而Nav A3C+D2需在整個環境內學習控制策略.與單區域不同,在多區域環境中,當機器人接觸到目標后,將被隨機重置到分布式環境中的任一位置,而不再局限于單個區域.

多區域導航實驗結果如圖14所示,其中,在各區域策略穩定收斂前,區域化模型和終身學習模型獎勵為同一時間內各子模塊所獲獎勵的平均值.待策略集成后,獎勵為區域間導航所得.由圖14可知,在分布式環境中,隨著區域數量的增加,受神經網絡記憶能力限制,使用單一模型的Nav A3C+D2和區域導航子模塊的性能會隨之降低,雖然增加LSTM層數可在一定程度上減緩性能下降,但無法解決根本問題,且增加的訓練難度也是難以承受的.區域化模型利用子模塊在各區域內學習控制策略,并通過策略的切換和結合實現區域間導航,受區域數量的影響較小.與此同時,由于使用了改進的訓練方法,維持了較高的學習效率和導航性能.終身學習模型同樣可實現策略的切換和結合,但由于模型本身限制,難以形成高獎勵的控制策略.同時可以看出,區域之間策略的切換和結合并不完美,這也是圖中策略集成后獎勵降低的原因.

圖14?? 多區域導航實驗結果

Fig.14?? Experiment results of multi-area navigation

4 結語

本文提出一種區域化視覺導航方法,面對分布式環境,該方法使用子模塊在各區域內獨立學習控制策略,并通過區域化模型集成控制策略完成大范圍導航.經實驗驗證,相比單一模型,區域化模型受神經網絡記憶能力和區域數量影響較小,可更好地完成多區域環境下的導航任務,且在訓練過程中結合景深避障和獎勵預測,使得子模塊可高效探索環境,同時獲取良好導航策略.實際上,區域化并不是一個陌生的詞語,它早已出現在生活的方方面面,如人類居住的環境就是根據區域劃分.此外,區域劃分還在道路規劃、災害救援和無人機導航等領域發揮作用,其中最具代表性的是醫學圖片研究中的區域分割,該方法是分辨病變位置和種類的基礎.本文提出的區域化導航方法可應用于倉儲機器人、無人駕駛車輛、無人機及無人船等無人智能系統.但文中環境分割通過人工實現,未來將在自主區域劃分做出進一步研究.

關注微信公眾號：人工智能技術與咨詢。了解更多咨詢！

編輯：fqj

閱讀全文

目標檢測(15425) 目標檢測(15425)
深度學習(119795) 深度學習(119795)

為什么深度學習的效果更好？

導讀深度學習是機器學習的一個子集，已成為人工智能領域的一項變革性技術，在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度學習的有效性并非偶然，而是植根于幾個基本原則和進步

2024-03-09 08:26:27

上海交通大學徐匯校區包兆龍圖書館修繕工程電氣火災監控系統 Acrelsale1

安科瑞程瑜? 基本信息：項目名稱：上海交通大學徐匯校區包兆龍圖書館修繕工程電氣火災監控系統項目地點：上海市徐匯區實施時間：2015年項目簡介：香港著名實業家包玉剛先生投資1000萬美元

2024-02-05 14:47:52

186

基于機器視覺和深度學習的焊接質量檢測系統

基于機器視覺和深度學習的焊接質量檢測系統是一種創新性的技術解決方案，它結合了先進的計算機視覺和深度學習算法，用于實時監測和評估焊接過程中的焊縫質量。這一系統在工業制造中發揮著重要作用，提高了焊接質量

2024-01-18 17:50:52

239

轉載：FCS Perspective | 上海交通大學陳海波教授團隊——元OS：面向萬物智聯時代的操作系統

導讀 ? ? ?本期FCS Perspective欄目，特邀上海交通大學陳海波教授的觀點分享——Embracing connected intelligence with the YuanOS

2024-01-17 15:22:05

148

什么是深度學習？機器學習和深度學習的主要差異

2016年AlphaGo 擊敗韓國圍棋冠軍李世石，在媒體報道中，曾多次提及“深度學習”這個概念。

2024-01-15 10:31:30

401

深度學習在人工智能領域的經典應用

由于深度學習，圖像識別和計算機視覺任務的性能得到了顯著提高。由于在龐大的數據集上訓練深度神經網絡，計算機現在可以可靠地分類和理解圖像，從而開辟了廣泛的應用。智能手機應用程序可以從照片中快速確定

2023-12-15 16:50:49

163

博瓦科技外來人員入侵人臉識別報警區域入侵識別監控系統

區域入侵識別監控系統借助智能視頻分析技術和YOLO深度學習技術的支持，能夠對現場監控攝像機獲取的視頻進行實時分析和處理。系統根據預先設定的禁止入內地區，通過現場監測攝像機可以準確地監測

2023-12-11 14:57:28

西安交通大學微電子校友論壇在蘇州高新區成功舉辦

　根據相關報道，蘇州高新區已與西安交通大學建立深厚交流與合作基礎，設立了西安交大創新創業學院蘇州分院等機構。今年3月，雙方共同組建了西安交通大學蘇州高新區人才工作站，深度對接西安交大的優勢學科科研項目與人才資源，達成眾多合作計劃。

2023-12-11 14:40:00

240

GPU在深度學習中的應用與優勢

人工智能的飛速發展，深度學習作為其重要分支，正在推動著諸多領域的創新。在這個過程中，GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣，GPU在深度學習中擁有舉足輕重的地位。那么，GPU在深度

2023-12-06 08:27:37

606

季豐電子榮膺2023上海交大“未來領軍”企業

11月23日，由上海交通大學主辦、上海臨港經濟發展（集團）有限公司聯合主辦的2023交大創業者（秋季）大會在上海漕河涇開發區舉行。

2023-11-25 09:07:56

318

Neuro-T：零代碼自動深度學習訓練平臺

友思特 Neuro-T為傳統的深度學習視覺檢測方案提供了“自動深度學習”的解決方案，結合自動標注功能，一鍵生成高性能視覺檢測模型，無需AI領域專業知識即可創建深度學習視覺檢測模型。

2023-11-24 17:58:33

242

深度學習在植物病害目標檢測研究進展

關注。中國農業科學院農業信息研究所/農業農村部農業大數據重點實驗室聯手甘肅農業大學機電工程學院，組成科研團隊，針對深度學習在植物葉部病害檢測與識別展開研究，植物病害目標檢測是利用計算機視覺技術在復雜自然條件

2023-11-20 17:19:42

245

感謝大連交通大學對我司HS-100A恒溫恒濕試驗箱的認可

隨著科技的發展，各行各業對產品測試的需求日益增長。在這個過程中，恒溫恒濕試驗箱作為一種重要的測試設備，扮演著不可或缺的角色。近日，我司的HS-100A恒溫恒濕試驗箱得到了大連交通大學的認可，這標志著

2023-11-20 11:38:10

130

基于深度學習的3D點云實例分割方法

3D實例分割（3DIS）是3D領域深度學習的核心問題。給定由點云表示的 3D 場景，我們尋求為每個點分配語義類和唯一的實例標簽。 3DIS 是一項重要的 3D 感知任務，在自動駕駛、增強現實和機器人導航等領域有著廣泛的應用，其中可以利用點云數據來補充 2D 圖像提供的信息。

2023-11-13 10:34:27

367

深度學習算法和傳統機器視覺助力工業外觀檢測

在很多人眼里，深度學習是一個非常神奇的技術，是人工智能的未來，是機器學習的圣杯。今天深視創新帶您一起揭開他神秘的面紗，了解什么才是深度學習。

2023-11-09 10:58:02

421

首屆OpenHarmony競賽訓練營結營頒獎，75所高校學子助力建設開源生態

OpenHarmony在數據可視化方面的能力。在本次比賽中，榮獲三等獎的隊伍分別是：華中科技大學的“宵宮世界第一”賽隊、“閣下又將如何應隊”賽隊以及“1024隊”。而上海交通大學的“Almony”賽隊則獲得了創新獎

2023-11-07 17:10:05

上海大學選購我司HS-STA-002同步熱分析儀

對科研設備的重視，也標志著我司在科技與教育領域的深度融合。上海大學HS-STA-002同步熱分析儀是一種尖端的科研設備，它可以同步進行熱分析和熱重分析，以及DSC，

2023-11-06 16:10:54

176

云天勵飛與上海交大國際與公共事務學院合作推動人工智能產業快速發展

近日，上海交通大學國際與公共事務學院二十周年院慶大會在上海交通大學徐匯校區文治堂舉行。大會上，云天勵飛與與上海交大國際與公共事務學院簽訂戰略合作協議。上海交大領導

2023-10-31 14:12:19

585

推動城市可持續發展云天勵飛陳寧出席2023全球城市論壇

市住房和城鄉建設管理委員會、上海交通大學、聯合國人居署、世界銀行、上海市閔行區人民政府共同主辦，上海交通大學中國城市治理研究院、上海交通大學國際與公共事務學院、上海世界城市日事務協調中心、上海交通大學上海高級金融學院承辦。來

2023-10-31 11:27:23

124

什么是強化學習

強化學習是機器學習的方式之一，它與監督學習、無監督學習并列，是三種機器學習訓練方法之一。在圍棋上擊敗世界第一李世石的 AlphaGo、在《星際爭霸2》中以 10：1 擊敗了人類頂級職業玩家

2023-10-30 11:36:40

1042

西南交通大學攜手華為部署四川首例Wi-Fi 7，打造高品質萬兆校園網絡底座

西南交通大學坐落于中國歷史文化名城——成都。學校已建校127年，軌道交通學科群實力位居全國前列，已建立起世界軌道交通領域最完備的學科專業體系、人才培養體系和科研創新體系，是國家首批“雙一流”重點建設

2023-10-24 19:40:04

585

【直播預告】LabVIEW機械手視覺糾偏關鍵技術探討

編程視覺通用軟件，目前已被多家自動化設備公司采購，累計銷售量500多套。利用LabVIEW結合深度學習開發了“PCBA插件AOI檢測設備”、”鋰電池蓋板焊接缺陷檢測軟件“，目前運行穩定，已批量出貨。

2023-10-17 15:37:40

第一！vivo自研AI大模型位列C-Eval、CMMLU榜首

C-Eval榜單是由清華大學、上海交通大學和愛丁堡大學合作構建的面向中文語言模型的綜合性考試評測集，涵蓋52個不同學科，共有13948道多項選擇題，是目前較為權威的中文AI大模型評測榜單。

2023-10-16 15:51:01

405

深度學習在語音識別中的應用及挑戰

一、引言隨著深度學習技術的快速發展，其在語音識別領域的應用也日益廣泛。深度學習技術可以有效地提高語音識別的精度和效率，并且被廣泛應用于各種應用場景。本文將探討深度學習在語音識別中的應用及所面臨

2023-10-10 18:14:53

444

深度學習的由來深度學習的經典算法有哪些

深度學習作為機器學習的一個分支，其學習方法可以分為監督學習和無監督學習。兩種方法都具有其獨特的學習模型：多層感知機、卷積神經網絡等屬于監督學習；深度置信網、自動編碼器、去噪自動編碼器、稀疏編碼等屬于無監督學習。

2023-10-09 10:23:42

301

NeurIPS 2023 | 擴散模型解決多任務強化學習問題

擴散模型（diffusion model）在 CV 領域甚至 NLP 領域都已經有了令人印象深刻的表現。最近的一些工作開始將 diffusion model 用于強化學習（RL）中來解決序列決策問題

2023-10-02 10:45:02

401

視覺導航關鍵技術及應用

由于視覺導航技術的應用越來越普及 ,因此 ,有必要對視覺導航中的關鍵技術及應用進行研究。文章對其中的圖像處理技術和定位與跟蹤技術進行了詳細研究 ,并與此相對應 ,介紹的相關的應用。

2023-09-25 08:09:38

一種結構化道路環境中的視覺導航系統詳解

根據結構化道路環境的特點提出了一種將邊沿檢測和道路環境知識相結合的機器視覺算法 , 并結合基于行為響應的路徑規劃方法和智能預瞄控制方法 , 實現了一套基本的機器人視覺導航系統 . 在自主機器人實驗

2023-09-25 07:23:39

智能輪椅導航定位的研究現狀及趨勢

,導航指示信號類型,導航地域等因素的不同,可以分為基于地圖導航,基于視覺導航,基于傳感器導航、GPS衛星導航等。無論采用哪種導航方法,智能輪椅都應具有路徑規劃與避障,探測與定位等功能。輪椅自主導航主要由環境感知自定位運動路徑規劃和目標確定等幾個功能模塊組成。

2023-09-25 07:13:35

瑞薩電子深度學習算法在缺陷檢測領域的應用

浪費大量的人力成本。因此，越來越多的工程師開始將深度學習算法引入缺陷檢測領域，因為深度學習在特征提取和定位方面取得了非常好的效果。

2023-09-22 12:19:00

449

視覺深度學習遷移學習訓練框架Torchvision介紹

Torchvision是基于Pytorch的視覺深度學習遷移學習訓練框架，當前支持的圖像分類、對象檢測、實例分割、語義分割、姿態評估模型的遷移學習訓練與評估。支持對數據集的合成、變換、增強等，此外還支持預訓練模型庫下載相關的模型，直接預測推理。

2023-09-22 09:49:51

391

反思深度學習與傳統計算機視覺的關系

某種程度上，深度學習最大的優勢就是自動創建沒有人會想到的特性能力。如今，深度學習在眾多領域都有一席之地，尤其是在計算機視覺領域。盡管許多人都為之深深著迷，然而，深網就相當于一個黑盒子，我們大多數人

2023-09-12 08:29:46

372

一文詳解機器學習和深度學習的區別

深度學習這幾年特別火，就像5年前的大數據一樣，不過深度學習其主要還是屬于機器學習的范疇領域內，所以這篇文章里面我們來嘮一嘮機器學習和深度學習的算法流程區別。

2023-09-06 12:48:40

1174

模擬矩陣在深度強化學習智能控制系統中的應用

訊維模擬矩陣在深度強化學習智能控制系統中的應用主要是通過構建一個包含多種環境信息和動作空間的模擬矩陣，來模擬和預測深度強化學習智能控制系統在不同環境下的表現和效果，從而優化控制策略和提高系統的性能

2023-09-04 14:26:36

294

深度學習在醫學圖像分割與病變識別中的應用實戰

等方面具有重要意義。本文將介紹這一領域的背景、挑戰，以及通過一個代碼實例展示如何利用深度學習方法進行醫學圖像分割與病變識別。背景與挑戰醫學圖像分割是將醫學影像中的結構區域分離出來，以便醫生能夠更清晰

2023-09-04 11:11:23

上海交通大學完整課件！《電化學傳感器》

電化學傳感器由膜電極和電解液灌封而成。濃度（氣體）信號將電解液分解成陰陽帶電離子，通過電極將信號傳出。它的優點是：反映速度快、準確（可用于ppm級），穩定性好、能夠定量檢測，但壽命較短（大于等于兩年）。它主要適用于毒性氣體的檢測。目前國際上絕大部分毒氣檢測采用該類型傳感器。審核編輯黃宇 ?

2023-08-30 11:47:28

459

機器學習和深度學習的區別

　　機器學習和深度學習是當今最流行的人工智能(AI)技術之一。這兩種技術都有助于在不需要人類干預的情況下讓計算機自主學習和改進預測模型。本文將探討機器學習和深度學習的概念以及二者之間的區別。

2023-08-28 17:31:09

884

深度學習的定義和特點深度學習典型模型介紹

深度學習（Deep Learning）是一種基于人工神經網絡的機器學習算法，其主要特點是模型由多個隱層組成，可以自動地學習特征，并進行預測或分類。該算法在計算機視覺、語音識別、自然語言處理、推薦系統和數據挖掘等領域被廣泛應用，成為機器學習領域的一種重要分支。

2023-08-21 18:22:53

923

計算機視覺中的九種深度學習技術

計算機視覺中仍有許多具有挑戰性的問題需要解決。然而，深度學習方法正在針對某些特定問題取得最新成果。在最基本的問題上，最有趣的不僅僅是深度學習模型的表現;事實上，單個模型可以從圖像中學習意義并執行視覺任務，從而無需使用專門的手工制作方法。

2023-08-21 09:56:05

306

AI發展的三大趨勢

從計算攝影、3D感知到AIGC，視覺AI引領時代新潮流。8月18日至21日，由中國計算機學會(CCF)主辦，CCF計算機輔助設計與圖形學專業委員會、華東師范大學、上海交通大學、上海閔行區人民政府共同

2023-08-21 08:09:24

364

機器學習和深度學習的區別

機器學習和深度學習的區別隨著人工智能技術的不斷發展，機器學習和深度學習已經成為大家熟知的兩個術語。雖然它們都屬于人工智能技術的研究領域，但它們之間有很大的差異。本文將詳細介紹機器學習和深度學習

2023-08-17 16:11:40

2715

深度學習服務器怎么做深度學習服務器diy 深度學習服務器主板用什么

深度學習服務器怎么做深度學習服務器diy 深度學習服務器主板用什么? 隨著人工智能的飛速發展，越來越多的人開始投身于深度學習領域。但是，隨著深度學習的算法越來越復雜，需要更大的計算能力才能運行

2023-08-17 16:11:29

489

深度學習框架和深度學習算法教程

了基于神經網絡的機器學習方法。深度學習算法可以分為兩大類：監督學習和無監督學習。監督學習的基本任務是訓練模型去學習輸入數據的特征和其對應的標簽，然后用于新數據的預測。而無監督學習通常用于聚類、降維和生成模型等任務中

2023-08-17 16:11:26

637

深度學習框架連接技術

深度學習框架連接技術深度學習框架是一個能夠幫助機器學習和人工智能開發人員輕松進行模型訓練、優化及評估的軟件庫。深度學習框架連接技術則是需要使用深度學習模型的應用程序必不可少的技術，通過連接技術

2023-08-17 16:11:16

443

深度學習算法庫框架學習

深度學習算法庫框架學習深度學習是一種非常強大的機器學習方法，它可以用于許多不同的應用程序，例如計算機視覺、語言處理和自然語言處理。然而，實現深度學習技術需要使用一些算法庫框架。在本文中，我們將探討

2023-08-17 16:11:07

411

深度學習框架的作用是什么

深度學習框架的作用是什么深度學習是一種計算機技術，它利用人工神經網絡來模擬人類的學習過程。由于其高度的精確性和精度，深度學習已成為現代計算機科學領域的重要工具。然而，要在深度學習中實現高度復雜

2023-08-17 16:10:57

1070

深度學習框架是什么？深度學習框架有哪些？

深度學習框架是什么？深度學習框架有哪些？? 深度學習框架是一種軟件工具，它可以幫助開發者輕松快速地構建和訓練深度神經網絡模型。與手動編寫代碼相比，深度學習框架可以大大減少開發和調試的時間和精力，并提

2023-08-17 16:03:09

1585

什么是深度學習算法？深度學習算法的應用

什么是深度學習算法？深度學習算法的應用深度學習算法被認為是人工智能的核心，它是一種模仿人類大腦神經元的計算模型。深度學習是機器學習的一種變體，主要通過變換各種架構來對大量數據進行學習以及分類處理

2023-08-17 16:03:04

1299

深度學習算法工程師是做什么

，如醫療、金融、自然語言處理、智能交通等等。作為深度學習算法工程師，他們需要具備一定的技能和知識，包括數學基礎（如線性代數、微積分、概率論等）、編程語言（如Python、C++、Matlab等）、機器學習算法、深度學習算法（如神

2023-08-17 16:03:01

723

深度學習是什么領域

深度學習是什么領域? 深度學習是機器學習的一種子集，由多層神經網絡組成。它是一種自動學習技術，可以從數據中學習高層次的抽象模型，以進行推斷和預測。深度學習廣泛應用于計算機視覺、語音識別、自然語言處理

2023-08-17 16:02:59

984

深度學習算法簡介深度學習算法是什么深度學習算法有哪些

深度學習算法簡介深度學習算法是什么?深度學習算法有哪些?? 作為一種現代化、前沿化的技術，深度學習已經在很多領域得到了廣泛的應用，其能夠不斷地從數據中提取最基本的特征，從而對大量的信息進行機器學習

2023-08-17 16:02:56

5989

深度學習的七種策略

深度學習的七種策略深度學習已經成為了人工智能領域的熱門話題，它能夠幫助人們更好地理解和處理自然語言、圖形圖像、語音等各種數據。然而，要想獲得最好的效果，只是使用深度學習技術不夠。要獲得最好的結果

2023-08-17 16:02:53

1166

深度學習基本概念

深度學習基本概念? 深度學習是人工智能（AI）領域的一個重要分支，它模仿人類神經系統的工作方式，使用大量數據訓練神經網絡，從而實現自動化的模式識別和決策。在科技發展的今天，深度學習已經成為了計算機

2023-08-17 16:02:49

979

GA-ASI自主作戰無人機生態系統介紹

基于深度強化學習的簽名管理技能由GA-ASI開發。技能開發利用了GA-ASI新穎的強化學習（Reinforcement Learning，RL）架構，該架構使用了敏捷軟件方法和行業標準工具（例如Docker和Kubernetes）。

2023-08-17 11:34:29

440

深度學習視角下的貓狗圖像識別實現

來源：易百納技術社區，作者：稗子釀的酒人工智能技術在圖像識別領域取得了顯著進展，其中基于深度學習的圖像分類方法在貓狗圖像識別中表現出色。本文將介紹使用深度學習技術實現貓狗圖像分類的方法，具體

2023-08-15 10:38:30

1614

使用LabVIEW 實現物體識別、圖像分割、文字識別、人臉識別等深度視覺

LabVIEW可以實現深度學習嘛，今天我們一起來看看使用LabVIEW 實現物體識別、圖像分割、文字識別、人臉識別等深度視覺

2023-08-11 16:02:21

758

機器視覺方法有哪些類型機器視覺的基本功能包括哪些方面

深度學習是基于神經網絡的一種機器學習方法，通過多層次的神經網絡結構來學習圖像的特征表示。深度學習在機器視覺領域取得了巨大的突破和成功，常見的模型包括卷積神經網絡（CNN）、循環神經網絡（RNN）、生成對抗網絡（GAN）等。

2023-08-08 12:43:00

1187

上海機器視覺展會虹科精彩表現

檢測設備類、視覺軟件和其它配件等六大類別產品和方案的多家企業，同時還了舉辦機器視覺技術與工業應用研討會，聚焦3D技術+機器人、AI+深度學習、新產品發布、機器視覺

2023-07-31 22:23:09

313

華東交通大學領導一行蒞臨信盈達參觀交流

為了更好地了解企業人才需求與就業能力需求，提升應用型人才培養質量。2023年5月7日下午14點，華東交通大學電子信息專業系主任付智輝、展教授一行應邀前往信盈達華南區總部進行參觀考察，公司創始人

2023-07-31 16:52:27

590

AI、機器學習和深度學習的區別及應用

深度學習和神經網絡的區別在于隱藏層的深度。一般來說，神經網絡的隱藏層要比實現深度學習的系統淺得多，而深度學習的在隱藏層可以有很多層。

2023-07-28 10:44:27

295

基于機器視覺的比亞迪電池焊后3D視覺檢測方法

隨之3D相機在工業AI的普及，深度學習對3D點云和深度圖的分析方法也越來越多樣化。

2023-07-26 11:41:53

247

語言模型做先驗，統一強化學習智能體，DeepMind選擇走這條通用AI之路

體的發展，從最早的 AlphaGo、AlphaZero 到后來的多模態、多任務、多具身 AI 智能體 Gato，智能體的訓練方法和能力都在不斷演進。從中不難發現，隨著大模型越來越成為人工智能發展的主流趨勢，DeepMind 在智能體的開發中不斷嘗試將強化學習與自然語言處理、計算機視覺

2023-07-24 16:55:02

295

什么是深度強化學習？深度強化學習在自動駕駛領域的應用

最近，人工智能領域最火的莫過于大模型了。

2023-07-24 10:37:41

1004

基于深度學習的點云分割的方法介紹

　　摘要：點云分割是點云數據理解中的一個關鍵技術，但傳統算法無法進行實時語義分割。近年來深度學習被應用在點云分割上并取得了重要進展。綜述了近四年來基于深度學習的點云分割的最新工作，按基本思想分為

2023-07-20 15:23:59

基于強化學習的目標檢測算法案例

摘要：基于強化學習的目標檢測算法在檢測過程中通常采用預定義搜索行為，其產生的候選區域形狀和尺寸變化單一，導致目標檢測精確度較低。為此，在基于深度強化學習的視覺目標檢測算法基礎上，提出聯合回歸與深度

2023-07-19 14:35:02

傳統視覺及深度學習檢測，存在哪些問題？#機器視覺 #深度學習 #自動化 #智能制造#硬聲創作季

機器視覺

或許發布于 2023-07-14 09:06:33

45. 5 2 強化學習（深度強化學習） #硬聲創作季

機器學習

充八萬發布于 2023-07-07 01:56:26

什么是深度強化學習?深度強化學習算法應用分析

什么是深度強化學習? 眾所周知，人類擅長解決各種挑戰性的問題，從低級的運動控制(如：步行、跑步、打網球)到高級的認知任務。

2023-07-01 10:29:50

1000

聯合電子高級研究計劃 (UARP) 校企合作項目簽約儀式

6月28日，聯合電子舉行高級研究計劃（UAES Advanced Research Program）校企合作項目簽約儀式，與上海交通大學、同濟大學、上海大學簽訂首批8個UARP項目，將共同開展關于

2023-07-01 09:25:02

813

深度解析可擴展且保密的深度學習

可擴展且保密的深度學習

2023-06-28 16:09:14

194

人工智能強化學習開源分享

電子發燒友網站提供《人工智能強化學習開源分享.zip》資料免費下載

2023-06-20 09:27:28

利用強化學習來探索更優排序算法的AI系統

前言 DeepMind 最近在 Nature 發表了一篇論文 AlphaDev[2, 3]，一個利用強化學習來探索更優排序算法的AI系統。 AlphaDev 系統直接從 CPU 匯編指令的層面入手

2023-06-19 10:49:27

357

深度Q學習網絡：彌合從虛擬游戲到實際應用的差距

人工智能（AI）和機器學習（ML）對從醫療保健和金融到能源和運輸的廣泛行業產生了深遠的影響。在各種人工智能技術中，強化學習（RL）——一種機器學習，代理通過與環境交互來學習做出決策——已成為

2023-06-15 09:45:34

200

基于深度強化學習的視覺反饋機械臂抓取系統

機械臂抓取擺放及堆疊物體是智能工廠流水線上常見的工序，可以有效的提升生產效率，本文針對機械臂的抓取擺放、抓取堆疊等常見任務，結合深度強化學習及視覺反饋，采用AprilTag視覺標簽、后視經驗回放機制

2023-06-12 11:25:22

1214

ICLR 2023 Spotlight｜節省95%訓練開銷，清華黃隆波團隊提出強化學習專用稀疏訓練框架RLx2

，可以節省至多 95% 的訓練開銷。深度強化學習模型的訓練通常需要很高的計算成本，因此對深度強化學習模型進行稀疏化處理具有加快訓練速度和拓展模型部署的巨大潛力。然而現有的生成小型模型的方法主要基于知識蒸餾，即通過迭

2023-06-11 21:40:02

356

淺談深度學習在計算機視覺領域的三大瓶頸

深度學習能夠實現的前提是大量經過標注的數據，這使得計算機視覺領域的研究人員傾向于在數據資源豐富的領域搞研究，而不是去重要的領域搞研究。

2023-06-11 10:22:53

249

徹底改變算法交易：強化學習的力量

強化學習（RL）是人工智能的一個子領域，專注于決策過程。與其他形式的機器學習相比，強化學習模型通過與環境交互并以獎勵或懲罰的形式接收反饋來學習。

2023-06-09 09:23:23

355

西安交通大學選購我司HS-80C高低溫試驗箱

。西安交通大學選購我司HS-80C高低溫試驗箱，現已安裝調試完畢。西安交通大學上海和晟HS-80C高低溫試驗箱上海和晟HS-80C高低溫試驗箱上海和晟HS-80C高低

2023-06-03 09:12:16

262

機器學習筆記之優化-拉格朗日乘子法和對偶分解

優化是機器學習中的關鍵步驟。在這個機器學習系列中，我們將簡要介紹優化問題，然后探討兩種特定的優化方法，即拉格朗日乘子和對偶分解。這兩種方法在機器學習、強化學習和圖模型中非常流行。

2023-05-30 16:47:17

1333

為什么深度學習是非參數的？

今天我想要與大家分享的是深度神經網絡的工作方式，以及深度神經與“傳統”機器學習模型的不同之處。

2023-05-25 15:13:54

268

基于多智能體深度強化學習的體系任務分配方法

為了應對在未來復雜的戰場環境下，由于通信受限等原因導致的集中式決策模式難以實施的情況，提出了一個基于多智能體深度強化學習方法的分布式作戰體系任務分配算法，該算法為各作戰單元均設計一個獨立的策略網絡

2023-05-18 16:46:43

2444

西安交通大學：接地式液滴發電機作為自驅動傳感器用于液體的監測

傳感新品【西安交通大學：接地式液滴發電機作為自驅動傳感器用于液體的監測】傳統單電極的固-液摩擦納米發電機由于界面效應的限制，其起電信號通常十分微弱。2020年《Nature》報道一種類晶體管

2023-05-18 08:41:12

397

校源行｜北京交通大學開放原子開源社團成立大會成功舉辦

5月11日，北京交通大學開放原子開源社團成立大會在北京成功舉辦。開放原子開源基金會（以下簡稱“基金會”）理事長助理劉京娟、資深顧問郭晧、活動顧問孫廣毅，北京交通大學軟件學院黨委副書記、副院長

2023-05-13 09:00:02

1039

電子科技大學選購我司HS-TGA-102熱重分析儀

電子科技大學坐落于四川省成都市，原名成都電訊工程學院，是1956年在周恩來總理的親自部署下，由交通大學（現上海交通大學、西安交通大學）、南京工學院（現東南大學）、華南工學院（現華南理工大學）的電訊

2023-05-11 15:29:55

254

重慶交通大學采購差示掃描量熱儀DSC300C

的不同，可以選擇不同的溫度儀器。重慶交通大學采購是半導體制冷的差示掃描量熱儀，溫度范圍是-40~600℃，可多段溫度設置，軟件和儀器雙向控制系統，操作方便。 ? 差示掃描量熱儀測試范圍廣泛，包括：玻璃化轉變溫度測試、相轉變測試、熔融和熱焓值測試、產品穩定

2023-05-10 11:02:04

257

GPU引領的深度學習

早期的機器學習以搜索為基礎，主要依靠進行過一定優化的暴力方法。但是隨著機器學習逐漸成熟，它開始專注于加速技術已經很成熟的統計方法和優化問題。同時深度學習的問世更是帶來原本可能無法實現的優化方法。本文將介紹現代機器學習如何找到兼顧規模和速度的新方法。

2023-05-09 09:58:33

540

?計算機視覺深度學習訓練推理框架

PyTorch是由Facebook人工智能研究小組開發的一種基于Lua編寫的Torch庫的Python實現的深度學習庫，也是目前使用范圍和體驗感最好的一款深度學習框架。

2023-05-08 14:20:58

773

深度學習中的圖像分割

深度學習可以學習視覺輸入的模式，以預測組成圖像的對象類。用于圖像處理的主要深度學習架構是卷積神經網絡(CNN)，或者是特定的CNN框架，如AlexNet、VGG、Inception和ResNet。計算機視覺的深度學習模型通常在專門的圖形處理單元(GPU)上訓練和執行，以減少計算時間。

2023-05-05 11:35:28

720

智造之眼丨深度學習應用

智造之眼?科學設計深度學習各應用流程，在盡量簡化前期準備工作的基礎上為客戶提供穩定且準確的深度學習解決方案。

2023-05-04 16:55:52

424

共話人才培養和科技創新，上海集成電路產教融合大會圓滿落幕！

選擇進入企業學習或向學術轉變，通過“雙導師貫穿全過程”和“回歸實驗室縱向課題”等策略，極大限度開發學生的優質潛能，專注培養國際一流的電子信息領域復合型高端人才。 △上海交通大學電子信息與電氣工程

2023-04-28 17:48:10

無懼黑暗強光，純視覺導航也能全天候作業

對于一臺激光導航掃地機器人而言，全天候作業并非難事，那么純視覺導航掃地機器人能做到嗎？無論對于人，還是機器人，光線環境的變化對“眼睛”的影響都是致命的。由于視覺傳感器對于光線十分敏感，在家庭場景

2023-04-28 11:05:24

618

理解如何處理計算機視覺和深度學習中的圖像數據

在過去幾年從事多個計算機視覺和深度學習項目之后，我在這個博客中收集了關于如何處理圖像數據的想法。對數據進行預處理基本上要比直接將其輸入深度學習模型更好。有時，甚至可能不需要深度學習模型，經過一些處理后一個簡單的分類器可能就足夠了。

2023-04-26 11:57:12

457

悉尼大學最新綜述：深度學習圖像摳圖

自深度學習出現之后，研究者設計出了多種多樣的基于卷積神經網絡的解決方案。和傳統方法一樣，早期的深度學習方法依然需要依賴一定量的人工輔助信息，例如三分圖（trimap），涂抹（scribble），背景圖像等等

2023-04-20 09:31:43

399

TSC峰會回顧02 | 上海交通大學OpenHarmony技術俱樂部建設

嘉賓簡介夏虞斌，上海交通大學教授/博導；上海交通大學OpenHarmony技術俱樂部主任；中國計算機學會CCF高級會員、IEEE會員、ACM會員。主要研究領域是操作系統與系統結構，研究興趣為通過軟硬

2023-04-19 15:12:22

超詳細的3D視覺技術學習路線

我們生活在三維空間中，如何智能地感知和探索外部環境一直是個熱點難題。2D視覺技術借助強大的計算機視覺和深度學習算法取得了超越人類認知的成就，而3D視覺則因為算法建模和環境依賴等問題，一直處于正在研究

2023-04-16 10:36:16

953

使用Isaac Gym 來強化學習mycobot 抓取任務

使用Isaac Gym來強化學習mycobot抓取任務

2023-04-11 14:57:12

5334

基于多智能體強化學習的自主移動機器人實時訂單調度

訂單調度，提出了一種使用多agent強化學習的方法，其中AMRagent根據各自的觀察學習對訂單進行投標。在機器人仿真環境中研究了該方法。結果表明，與常用的調度規則相比，該算法的訂單分配效率更高。

2023-04-11 10:59:24

復旦大學課題組利用 NVIDIA RTX GPU，深入計算機視覺的自動駕駛應用研究

的未來新思考。復旦大學大數據學院 Zhang Vision Group 成立于 2020 年，研究方向為計算機視覺和深度學習，其目標是通過神經網絡的數學模型理解物體、場景和運動的最通用表示，賦能下一代人工智能（AI）。目前，該課題組正致力于開

2023-04-11 09:10:08

471

人工智能與機器學習、深度學習的區別

人工智能包含了機器學習和深度學習。你可以在圖中看到，機器學習是人工智能的子集，深度學習是機器學習的子集。所以人工智能、機器學習和深度學習這三者的關系就像爺爺、父親與兒子。

2023-03-29 11:04:10

1101

【新聞】2023年全國大學生物聯網設計競賽（華為杯）啟動

&中移物聯網、樂鑫信息科技、霍尼韋爾、CSA聯盟、廣和通、TI、兆易創新等物聯網知名企業支持，南京大學、鄭州大學、東北大學、北京工業大學、湖南大學、上海交通大學等共同承辦，機械工業出版社支持

2023-03-24 09:33:43

已全部加載完成

搜索歷史