I am thrilled to have achieved the prestigious DeepRacer Top 10 badge! 😊
AWS DeepRacer 是Amazon Web Services( AWS )推出的一項服務,旨在協助開發者學習並實踐深度學習技術。它結合了機器學習、雲端運算和強化學習的概念,提供了一個實驗性的平台,使開發者能夠透過建造、訓練和比賽虛擬賽車來探索深度學習和強化學習的應用。
具體來說,AWS DeepRacer是一個小型的自走車模型,它可以在虛擬賽道上移動。使用者可以使用AWS DeepRacer控制台選擇不同的賽道,調整賽車模型的參數,並使用深度學習技術對賽車進行訓練。在訓練的過程中,強化學習演算法會根據賽車在賽道上的表現來調整模型的權重,以優化賽車的駕駛能力。
此外,AWS DeepRacer還提供了一個線上競賽平台,讓開發者將他們訓練好的模型與其他開發者的模型進行比賽。這種比賽不僅能夠展現開發者的技能,還能促使他們在競爭中不斷改進他們的模型。
整體而言,AWS DeepRacer是一個有趣且實用的工具,可以幫助開發者學習和實踐深度學習、強化學習以及雲端運算等技術。
讓我們整理一下機器學習與強化學習的區別:
機器學習是人工智慧的一個子集,有監督學習、無監督學習和強化學習三種主要類型。
DeepRacer 就是強化學習的一個範例,例如汽車(agent)對環境採取行動並獲得獎勵,通過比較每代的獎勵來優化模型。
總結一下就是機器學習依賴資料,而強化學習通過獎懲機制訓練模型,這是兩者的區別。
可以建立您的車庫
改裝自己的車輛(根據實際情況)
訓練自己的Models
建立Models,可以選擇續練的場地,細節等等
訓練演算法和超參數
可以在離散或連續操作空間中訓練代理程式。訓練 AWS DeepRacer 模型時,動作空間定義代理可用的速度和轉向角度組合。可以做出的單一速度和轉向角組合或選擇。
可選擇自訂的車型
訓練時間
查看訓練結果
附上實際Training configuration
def reward_function(params):
# Huge penalties
if not params['all_wheels_on_track']:
return float(1e-3)
# Base Reward
reward = 0
if params['speed'] > 0.9:
reward = 1 + params['speed']
else:
reward = 1e-3
# Center the car
track_width_half = params['track_width'] / 2
quadratic_center = (params['distance_from_center'] / track_width_half) ** 4
distance_from_center_reward = 1 - quadratic_center
reward += distance_from_center_reward
# Give a higher reward if the car is making progress towards the finish line
reward += (params['progress'] / params['steps']) * 100
# Give a higher reward if the car completes the track in the allotted time
if params['progress'] == 100:
reward += 2
return float(reward)