4 months ago · bd39760910
--- a/main/.buildinfo
+++ b/main/.buildinfo
@@ -1,4 +1,4 @@
 
				 # Sphinx build info version 1
			
 
				 # This file hashes the configuration used when building these files. When it is not found, a full rebuild will be done.
			
 
				-config: e85456c00c15a161776a9b33e8a804fc
			
 
				+config: cfb421b04e722064c6bedb20f4f636f4
			
 
				 tags: d77d1c0d9ca2f4c8421862c7c5a0d620
			
--- a/main/_modules/minigrid/wrappers/index.html
+++ b/main/_modules/minigrid/wrappers/index.html
@@ -501,7 +501,7 @@
 
				 <a class="viewcode-back" href="../../../api/wrappers/#minigrid.wrappers.PositionBonus">[docs]</a>
			
 
				 <span class="k">class</span><span class="w"> </span><span class="nc">PositionBonus</span><span class="p">(</span><span class="n">Wrapper</span><span class="p">):</span>
			
 
				 <span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
			
 
				-<span class="sd">    Adds an exploration bonus based on which positions</span>
			
 
				+<span class="sd">    Adds a scaled exploration bonus based on which positions</span>
			
 
				 <span class="sd">    are visited on the grid.</span>
			
 
				 
			
 
				 <span class="sd">    Note:</span>
			
@@ -518,7 +518,7 @@
 
				 <span class="sd">        &gt;&gt;&gt; _, reward, _, _, _ = env.step(1)</span>
			
 
				 <span class="sd">        &gt;&gt;&gt; print(reward)</span>
			
 
				 <span class="sd">        0</span>
			
 
				-<span class="sd">        &gt;&gt;&gt; env_bonus = PositionBonus(env)</span>
			
 
				+<span class="sd">        &gt;&gt;&gt; env_bonus = PositionBonus(env, scale=1)</span>
			
 
				 <span class="sd">        &gt;&gt;&gt; obs, _ = env_bonus.reset(seed=0)</span>
			
 
				 <span class="sd">        &gt;&gt;&gt; obs, reward, terminated, truncated, info = env_bonus.step(1)</span>
			
 
				 <span class="sd">        &gt;&gt;&gt; print(reward)</span>
			
@@ -528,7 +528,7 @@
 
				 <span class="sd">        0.7071067811865475</span>
			
 
				 <span class="sd">    &quot;&quot;&quot;</span>
			
 
				 
			
 
				-    <span class="k">def</span><span class="w"> </span><span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">env</span><span class="p">):</span>
			
 
				+    <span class="k">def</span><span class="w"> </span><span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
			
 
				 <span class="w">        </span><span class="sd">&quot;&quot;&quot;A wrapper that adds an exploration bonus to less visited positions.</span>
			
 
				 
			
 
				 <span class="sd">        Args:</span>
			
@@ -536,6 +536,7 @@
 
				 <span class="sd">        &quot;&quot;&quot;</span>
			
 
				         <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">env</span><span class="p">)</span>
			
 
				         <span class="bp">self</span><span class="o">.</span><span class="n">counts</span> <span class="o">=</span> <span class="p">{}</span>
			
 
				+        <span class="bp">self</span><span class="o">.</span><span class="n">scale</span> <span class="o">=</span> <span class="mi">1</span>
			
 
				 
			
 
				     <span class="k">def</span><span class="w"> </span><span class="nf">step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
			
 
				 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Steps through the environment with `action`.&quot;&quot;&quot;</span>
			
@@ -547,16 +548,14 @@
 
				         <span class="n">tup</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">agent_pos</span><span class="p">)</span>
			
 
				 
			
 
				         <span class="c1"># Get the count for this key</span>
			
 
				-        <span class="n">pre_count</span> <span class="o">=</span> <span class="mi">0</span>
			
 
				-        <span class="k">if</span> <span class="n">tup</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">counts</span><span class="p">:</span>
			
 
				-            <span class="n">pre_count</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">counts</span><span class="p">[</span><span class="n">tup</span><span class="p">]</span>
			
 
				+        <span class="n">pre_count</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">counts</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">tup</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
			
 
				 
			
 
				         <span class="c1"># Update the count for this key</span>
			
 
				         <span class="n">new_count</span> <span class="o">=</span> <span class="n">pre_count</span> <span class="o">+</span> <span class="mi">1</span>
			
 
				         <span class="bp">self</span><span class="o">.</span><span class="n">counts</span><span class="p">[</span><span class="n">tup</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_count</span>
			
 
				 
			
 
				         <span class="n">bonus</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">new_count</span><span class="p">)</span>
			
 
				-        <span class="n">reward</span> <span class="o">+=</span> <span class="n">bonus</span>
			
 
				+        <span class="n">reward</span> <span class="o">+=</span> <span class="n">bonus</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">scale</span>
			
 
				 
			
 
				         <span class="k">return</span> <span class="n">obs</span><span class="p">,</span> <span class="n">reward</span><span class="p">,</span> <span class="n">terminated</span><span class="p">,</span> <span class="n">truncated</span><span class="p">,</span> <span class="n">info</span></div>
			
 
				 
			
--- a/main/api/wrappers/index.html
+++ b/main/api/wrappers/index.html
--- a/main/environments/babyai/ActionObjDoor/index.html
+++ b/main/environments/babyai/ActionObjDoor/index.html
--- a/main/environments/babyai/BlockedUnlockPickup/index.html
+++ b/main/environments/babyai/BlockedUnlockPickup/index.html
--- a/main/environments/babyai/BossLevel/index.html
+++ b/main/environments/babyai/BossLevel/index.html
--- a/main/environments/babyai/BossLevelNoUnlock/index.html
+++ b/main/environments/babyai/BossLevelNoUnlock/index.html
--- a/main/environments/babyai/FindObjS5/index.html
+++ b/main/environments/babyai/FindObjS5/index.html
--- a/main/environments/babyai/GoTo/index.html
+++ b/main/environments/babyai/GoTo/index.html
--- a/main/environments/babyai/GoToDoor/index.html
+++ b/main/environments/babyai/GoToDoor/index.html
--- a/main/environments/babyai/GoToImpUnlock/index.html
+++ b/main/environments/babyai/GoToImpUnlock/index.html
--- a/main/environments/babyai/GoToLocal/index.html
+++ b/main/environments/babyai/GoToLocal/index.html
--- a/main/environments/babyai/GoToObj/index.html
+++ b/main/environments/babyai/GoToObj/index.html
--- a/main/environments/babyai/GoToObjDoor/index.html
+++ b/main/environments/babyai/GoToObjDoor/index.html
--- a/main/environments/babyai/GoToRedBall/index.html
+++ b/main/environments/babyai/GoToRedBall/index.html
--- a/main/environments/babyai/GoToRedBallGrey/index.html
+++ b/main/environments/babyai/GoToRedBallGrey/index.html
--- a/main/environments/babyai/GoToRedBallNoDists/index.html
+++ b/main/environments/babyai/GoToRedBallNoDists/index.html
--- a/main/environments/babyai/GoToRedBlueBall/index.html
+++ b/main/environments/babyai/GoToRedBlueBall/index.html
--- a/main/environments/babyai/GoToSeq/index.html
+++ b/main/environments/babyai/GoToSeq/index.html
--- a/main/environments/babyai/KeyCorridor/index.html
+++ b/main/environments/babyai/KeyCorridor/index.html
--- a/main/environments/babyai/KeyInBox/index.html
+++ b/main/environments/babyai/KeyInBox/index.html
--- a/main/environments/babyai/MiniBossLevel/index.html
+++ b/main/environments/babyai/MiniBossLevel/index.html
--- a/main/environments/babyai/MoveTwoAcross/index.html
+++ b/main/environments/babyai/MoveTwoAcross/index.html
--- a/main/environments/babyai/OneRoomS8/index.html
+++ b/main/environments/babyai/OneRoomS8/index.html
--- a/main/environments/babyai/Open/index.html
+++ b/main/environments/babyai/Open/index.html
--- a/main/environments/babyai/OpenDoor/index.html
+++ b/main/environments/babyai/OpenDoor/index.html
--- a/main/environments/babyai/OpenDoorsOrder/index.html
+++ b/main/environments/babyai/OpenDoorsOrder/index.html
--- a/main/environments/babyai/OpenRedDoor/index.html
+++ b/main/environments/babyai/OpenRedDoor/index.html
--- a/main/environments/babyai/OpenTwoDoors/index.html
+++ b/main/environments/babyai/OpenTwoDoors/index.html
--- a/main/environments/babyai/Pickup/index.html
+++ b/main/environments/babyai/Pickup/index.html
--- a/main/environments/babyai/PickupAbove/index.html
+++ b/main/environments/babyai/PickupAbove/index.html
--- a/main/environments/babyai/PickupDist/index.html
+++ b/main/environments/babyai/PickupDist/index.html
--- a/main/environments/babyai/PickupLoc/index.html
+++ b/main/environments/babyai/PickupLoc/index.html
--- a/main/environments/babyai/PutNext/index.html
+++ b/main/environments/babyai/PutNext/index.html
--- a/main/environments/babyai/PutNextLocal/index.html
+++ b/main/environments/babyai/PutNextLocal/index.html
--- a/main/environments/babyai/Synth/index.html
+++ b/main/environments/babyai/Synth/index.html
--- a/main/environments/babyai/SynthLoc/index.html
+++ b/main/environments/babyai/SynthLoc/index.html
--- a/main/environments/babyai/SynthSeq/index.html
+++ b/main/environments/babyai/SynthSeq/index.html
--- a/main/environments/babyai/UnblockPickup/index.html
+++ b/main/environments/babyai/UnblockPickup/index.html
--- a/main/environments/babyai/Unlock/index.html
+++ b/main/environments/babyai/Unlock/index.html
--- a/main/environments/babyai/UnlockLocal/index.html
+++ b/main/environments/babyai/UnlockLocal/index.html
--- a/main/environments/babyai/UnlockPickup/index.html
+++ b/main/environments/babyai/UnlockPickup/index.html
--- a/main/environments/babyai/UnlockToUnlock/index.html
+++ b/main/environments/babyai/UnlockToUnlock/index.html
--- a/main/environments/minigrid/BlockedUnlockPickupEnv/index.html
+++ b/main/environments/minigrid/BlockedUnlockPickupEnv/index.html
--- a/main/environments/minigrid/CrossingEnv/index.html
+++ b/main/environments/minigrid/CrossingEnv/index.html
--- a/main/environments/minigrid/DistShiftEnv/index.html
+++ b/main/environments/minigrid/DistShiftEnv/index.html
--- a/main/environments/minigrid/DoorKeyEnv/index.html
+++ b/main/environments/minigrid/DoorKeyEnv/index.html
--- a/main/environments/minigrid/DynamicObstaclesEnv/index.html
+++ b/main/environments/minigrid/DynamicObstaclesEnv/index.html
--- a/main/environments/minigrid/EmptyEnv/index.html
+++ b/main/environments/minigrid/EmptyEnv/index.html
--- a/main/environments/minigrid/FetchEnv/index.html
+++ b/main/environments/minigrid/FetchEnv/index.html
--- a/main/environments/minigrid/FourRoomsEnv/index.html
+++ b/main/environments/minigrid/FourRoomsEnv/index.html
--- a/main/environments/minigrid/GoToDoorEnv/index.html
+++ b/main/environments/minigrid/GoToDoorEnv/index.html
--- a/main/environments/minigrid/GoToObjectEnv/index.html
+++ b/main/environments/minigrid/GoToObjectEnv/index.html
--- a/main/environments/minigrid/KeyCorridorEnv/index.html
+++ b/main/environments/minigrid/KeyCorridorEnv/index.html
--- a/main/environments/minigrid/LavaGapEnv/index.html
+++ b/main/environments/minigrid/LavaGapEnv/index.html
--- a/main/environments/minigrid/LockedRoomEnv/index.html
+++ b/main/environments/minigrid/LockedRoomEnv/index.html
--- a/main/environments/minigrid/MemoryEnv/index.html
+++ b/main/environments/minigrid/MemoryEnv/index.html
--- a/main/environments/minigrid/MultiRoomEnv/index.html
+++ b/main/environments/minigrid/MultiRoomEnv/index.html
--- a/main/environments/minigrid/ObstructedMaze_1Dlhb/index.html
+++ b/main/environments/minigrid/ObstructedMaze_1Dlhb/index.html
--- a/main/environments/minigrid/ObstructedMaze_Full/index.html
+++ b/main/environments/minigrid/ObstructedMaze_Full/index.html
--- a/main/environments/minigrid/ObstructedMaze_Full_V1/index.html
+++ b/main/environments/minigrid/ObstructedMaze_Full_V1/index.html
--- a/main/environments/minigrid/PlaygroundEnv/index.html
+++ b/main/environments/minigrid/PlaygroundEnv/index.html
--- a/main/environments/minigrid/PutNearEnv/index.html
+++ b/main/environments/minigrid/PutNearEnv/index.html
--- a/main/environments/minigrid/RedBlueDoorEnv/index.html
+++ b/main/environments/minigrid/RedBlueDoorEnv/index.html
--- a/main/environments/minigrid/UnlockEnv/index.html
+++ b/main/environments/minigrid/UnlockEnv/index.html
--- a/main/environments/minigrid/UnlockPickupEnv/index.html
+++ b/main/environments/minigrid/UnlockPickupEnv/index.html
--- a/main/environments/wfc/WFCEnv/index.html
+++ b/main/environments/wfc/WFCEnv/index.html
--- a/main/searchindex.js
+++ b/main/searchindex.js