創(chuàng )澤機器人 |
CHUANGZE ROBOT |
人們使用機器人的目的是節約人力和時(shí)間并G效完成任務(wù)。傳統的機器人需要預先編程來(lái)滿(mǎn)足特定任務(wù),但如果任務(wù)發(fā)生變化,往往需要重新編程。而通過(guò)機器人的示教學(xué)習,它使機器人能夠自主地執行新任務(wù),允許用戶(hù)通過(guò)示教任務(wù)來(lái)教授機器人所需的技能,而無(wú)需繁瑣的重新編程。我們結合2020年ICIMIA 會(huì )議發(fā)表的《A Comprehensive Study onRobot Learning from Demonstration》文章,介紹了機器人示教學(xué)習LfD(Learning from Demonstration)的研究概況。
機器人可以通過(guò)采取行動(dòng)與所處環(huán)境交互,導致當前狀態(tài)到新?tīng)顟B(tài)的概率轉換。機器人活動(dòng)的環(huán)境可以被完全或部分觀(guān)察到。觀(guān)察性條件取決于示教數據采集方法的類(lèi)型以及所選擇的教學(xué)方法。在[6]中,對環(huán)境描述的方法進(jìn)行了研究。定義明確的目標可以清晰的評價(jià)任務(wù)表現,并改進(jìn)已學(xué)習的任務(wù)[7]。LfD目前沒(méi)有標準的評估參數或方法,這是因為到目前為止LfD框架缺乏通用性,沒(méi)有可以進(jìn)行比較的基準。人類(lèi)如何提供示教,基于與機器人的交互方式。
(1)低級技能
低級技能通常包括在三維空間中從一個(gè)點(diǎn)移動(dòng)到另一個(gè)點(diǎn)。它可以包括原始的動(dòng)作,如手勢、觸摸物體、挑選物體等,這種情況下獲得的示教數據是機器人關(guān)節的位置、速度和加速度。低級運動(dòng)可記錄在關(guān)節空間、任務(wù)空間或扭矩空間[11]。然而,在某些情況下,任務(wù)目標不能完全由關(guān)節位置來(lái)表示,應提供任務(wù)框架方面的額外信息。例如,挑選一個(gè)在每次示教中可能位于不同位置的目標對象。當這種低級技能在機器人框架中學(xué)習時(shí),軌跡可能沒(méi)有相似性,因此很難提取模型。但是,如果在任務(wù)框架中表示相同的對象,則可以得到相同對象的一般模型。一種常用的方法是跟蹤末端執行器相對于目標對象的笛卡爾坐標位置[12]。
低級技能學(xué)習或建模的三種主要方法:
1)動(dòng)態(tài)運動(dòng)基元(DMP):DMP方法的中心思想是依賴(lài)于一個(gè)可靠的動(dòng)態(tài)系統,調整該系統的非線(xiàn)性項,實(shí)現預期的吸引子行為。
圖3 DMP方法:字母書(shū)寫(xiě)技巧[50]的不變性
在圖3中,可以看出DMP的不變性性質(zhì)的重要性。藍線(xiàn)表示示教軌跡,紅線(xiàn)表示技能執行軌跡。起點(diǎn)是相似的,但是,即使target_0和target_1表示的終點(diǎn)不同,它也能夠執行低級技能。此外,還能根據示教的字母“a”生成“a”的一致放大版本。為了利用G度規則的結構和潛在空間來(lái)簡(jiǎn)化DMP方法,提出了一個(gè)G斯過(guò)程的隱藏變量模型[13]。在[9]中,通過(guò)調整DMP方程中的起始參數和目標參數,評估了一種泛化技能的方法,并在baxter機械臂上進(jìn)行了進(jìn)一步的論證。
2)G斯混合建模與回歸(GMM-GMR):該方法依賴(lài)于統計監督學(xué)習,由兩部分組成:a)使用G斯混合模型(GMM)對技能進(jìn)行編碼 b)利用G斯混合回歸(GMR)方法再現該技能。根據給定的示教,維度下降方法將數據投射到潛在空間中。這些方法可以執行局部線(xiàn)性變換[14]或利用任何全局非線(xiàn)性方法[15]。在[16]中,使用GMM作為一種技能學(xué)習算法,對7個(gè)關(guān)節角度的示教數據進(jìn)行預處理,進(jìn)一步采用k均值聚類(lèi)算法確定期望大值(EM)算法的初始均值和協(xié)方差。通過(guò)運行迭代算法提取一個(gè)GMM,并進(jìn)一步使用該GMM來(lái)執行一項技能。在[17]中使用GMM-GMR對技能編碼的類(lèi)似方法進(jìn)行了評估。
3)隱馬爾科夫模型(HMM):此類(lèi)模型基于概率方法。為了用隱馬爾可夫模型來(lái)建模低級技能,可以用隱藏狀態(tài)序列和所有的概率分布來(lái)表示該技能。HMM模型學(xué)習由兩部分組成:a)結構學(xué)習b)參數學(xué)習。結構學(xué)習處理識別隱藏狀態(tài)的數量。除此之外,它還涉及到確定這些隱藏狀態(tài)是如何相互聯(lián)系的。HMM模型學(xué)習的另一部分是參數學(xué)習,用于估計先驗、轉移和觀(guān)察概率分布。HMM模型使用概率分布,以便從當前狀態(tài)前進(jìn)到下一個(gè)狀態(tài),從而生成一個(gè)序列。該序列可以提供給控制器,以產(chǎn)生平滑的控制信號。應該注意的是,由于提供的示教并不是暫時(shí)一致的。所記錄的重復示教或者一批示教,其時(shí)間值不相同。即使是一個(gè)熟練的示教者也不可能提供完全相同的重復示教。因此,預處理步驟涉及動(dòng)態(tài)時(shí)間扭曲(DTW)技術(shù),該技術(shù)測量多個(gè)示教的時(shí)間序列之間的相似性。
![]() |
機器人招商 Disinfection Robot 機器人公司 機器人應用 智能醫療 物聯(lián)網(wǎng) 機器人排名 機器人企業(yè) 機器人政策 教育機器人 迎賓機器人 機器人開(kāi)發(fā) 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖 |