提交歷史

作者 SHA1 備註 提交日期
  Maxime Chevalier-Boisvert 290ab259e4 Modified RedBlueDoor env to enforce door opening sequence 7 年之前
  Maxime Chevalier-Boisvert c99822121e Added reward penalty based on number of time steps taken 7 年之前
  Maxime Chevalier-Boisvert 041225e96b Added position randomization to RedBlueDoors env. Updated README. 7 年之前
  Lucas Willems ec123f87cf Add a RedBlueDoors environment 7 年之前