適用自駕模型賽車之強化式學習演算法

Introduction

深度強化學習於近年來逐步朝向實務化的目標邁進,應用於自駕車決策行為之深度強化學習也隨之萌芽。其中,以亞馬遜(Amazon)所舉辦的世界級強化學習自動駕駛平台 AWS DeepRacer 最廣為人知,在僅使相機鏡頭影像為神經網路輸入的競速遊戲中,達到超越人類專家的表現。


發源於AWS DeepRacer,本團隊透過容器(container) 與 RPC (Remote Process Call)等技術,開發出一套高效端到端分散式訓練環境平台,可大幅加速AI模型訓練,並提升尋找最佳自駕賽車模型之效率。透過此平台,本團隊於 AWS DeepRacer 競賽上屢次獲得豐碩成果,包括2020 DeepRacer 世界冠軍賽第一名與第三名、2019 DeepRacer 世界冠軍賽第三名、與多次線上虛擬賽冠軍。


基於AWS DeepRacer 所累積的經驗,本團隊自主研發自駕車平台,透過深度學習架構 CycleGAN,將模擬器中影像透過風格轉換的方式合成實體影像,有效縮減虛實差異(sim2real gap)所帶來的效能損失,並提升自駕賽車於實體賽道中的表現。此方法超越過往透過域隨機化(Domain Randomization)處理之神經網路模型。此外,本團隊也提出了基於影像之自駕模型賽車動作平滑化(ICAPS),有效提升自駕車於高速行駛下的穩定性,在縮短賽道完圈時間的同時,大幅提高賽道完圈率,達到超越 DeepRacer 之表現。此技術發表於國際會議 ICRA 2022, Workshop on Opportunities and Challenges with Autonomous Racing 以及 IJCAI 2022, AI4AD workshop.


關鍵字 : 強化學習 人工智能 自動駕駛 賽車
研究計畫名稱 : 普適AI服務:數位轉型趨勢下的智慧型代理人(II)
計畫主持人 : 曾煜棋
子計畫主持人 : 吳毅成