2 years ago · 7751a5cbeb
--- a/minigrid/envs/babyai/core/roomgrid_level.py
+++ b/minigrid/envs/babyai/core/roomgrid_level.py
@@ -1,6 +1,8 @@
 
				 """
			
 
				 Copied and adapted from https://github.com/mila-iqia/babyai
			
 
				 """
			
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.roomgrid import RoomGrid
			
 
				 from minigrid.envs.babyai.core.verifier import (
			
 
				     ActionInstr,
			
@@ -44,9 +46,22 @@ class RoomGridLevel(RoomGrid):
 
				     of approximately similar difficulty.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, room_size=8, **kwargs):
			
 
				+    def __init__(self, room_size=8, max_steps: Optional[int] = None, **kwargs):
			
 
				         mission_space = BabyAIMissionSpace()
			
 
				-        super().__init__(room_size=room_size, mission_space=mission_space, **kwargs)
			
 
				+
			
 
				+        # If `max_steps` arg is passed it will be fixed for every episode,
			
 
				+        # if not it will vary after reset depending on the maze size.
			
 
				+        self.fixed_max_steps = False
			
 
				+        if max_steps is not None:
			
 
				+            self.fixed_max_steps = True
			
 
				+        else:
			
 
				+            max_steps = 0  # only for initialization
			
 
				+        super().__init__(
			
 
				+            room_size=room_size,
			
 
				+            mission_space=mission_space,
			
 
				+            max_steps=max_steps,
			
 
				+            **kwargs
			
 
				+        )
			
 
				 
			
 
				     def reset(self, **kwargs):
			
 
				         obs = super().reset(**kwargs)
			
@@ -58,7 +73,9 @@ class RoomGridLevel(RoomGrid):
 
				         nav_time_room = self.room_size**2
			
 
				         nav_time_maze = nav_time_room * self.num_rows * self.num_cols
			
 
				         num_navs = self.num_navs_needed(self.instrs)
			
 
				-        self.max_steps = num_navs * nav_time_maze
			
 
				+
			
 
				+        if not self.fixed_max_steps:
			
 
				+            self.max_steps = num_navs * nav_time_maze
			
 
				 
			
 
				         return obs
			
 
				 
			
--- a/minigrid/envs/babyai/open.py
+++ b/minigrid/envs/babyai/open.py
@@ -2,6 +2,7 @@
 
				 Copied and adapted from https://github.com/mila-iqia/babyai.
			
 
				 Levels described in the Baby AI ICLR 2019 submission, with the `Open` instruction.
			
 
				 """
			
 
				+from typing import Optional
			
 
				 
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.envs.babyai.core.roomgrid_level import RoomGridLevel
			
@@ -97,13 +98,23 @@ class OpenTwoDoors(RoomGridLevel):
 
				     This task requires memory (recurrent policy) to be solved effectively.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, first_color=None, second_color=None, strict=False, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        first_color=None,
			
 
				+        second_color=None,
			
 
				+        strict=False,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs
			
 
				+    ):
			
 
				         self.first_color = first_color
			
 
				         self.second_color = second_color
			
 
				         self.strict = strict
			
 
				 
			
 
				         room_size = 6
			
 
				-        super().__init__(room_size=room_size, max_steps=20 * room_size**2, **kwargs)
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 20 * room_size**2
			
 
				+
			
 
				+        super().__init__(room_size=room_size, max_steps=max_steps, **kwargs)
			
 
				 
			
 
				     def gen_mission(self):
			
 
				         colors = self._rand_subset(COLOR_NAMES, 2)
			
@@ -131,13 +142,18 @@ class OpenDoorsOrder(RoomGridLevel):
 
				     Open one or two doors in the order specified.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, num_doors, debug=False, **kwargs):
			
 
				+    def __init__(
			
 
				+        self, num_doors, debug=False, max_steps: Optional[int] = None, **kwargs
			
 
				+    ):
			
 
				         assert num_doors >= 2
			
 
				         self.num_doors = num_doors
			
 
				         self.debug = debug
			
 
				 
			
 
				         room_size = 6
			
 
				-        super().__init__(room_size=room_size, max_steps=20 * room_size**2, **kwargs)
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 20 * room_size**2
			
 
				+
			
 
				+        super().__init__(room_size=room_size, max_steps=max_steps, **kwargs)
			
 
				 
			
 
				     def gen_mission(self):
			
 
				         colors = self._rand_subset(COLOR_NAMES, self.num_doors)
			
--- a/minigrid/envs/babyai/other.py
+++ b/minigrid/envs/babyai/other.py
@@ -2,6 +2,7 @@
 
				 Copied and adapted from https://github.com/mila-iqia/babyai.
			
 
				 Levels described in the Baby AI ICLR 2019 submission, with different instructions than those in other files.
			
 
				 """
			
 
				+from typing import Optional
			
 
				 
			
 
				 from minigrid.envs.babyai.core.roomgrid_level import RoomGridLevel
			
 
				 from minigrid.envs.babyai.core.verifier import (
			
@@ -55,8 +56,12 @@ class FindObjS5(RoomGridLevel):
 
				     This level requires potentially exhaustive exploration
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, room_size=5, **kwargs):
			
 
				-        super().__init__(room_size=room_size, max_steps=20 * room_size**2, **kwargs)
			
 
				+    def __init__(self, room_size=5, max_steps: Optional[int] = None, **kwargs):
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 20 * room_size**2
			
 
				+
			
 
				+        super().__init__(room_size=room_size, max_steps=max_steps, **kwargs)
			
 
				 
			
 
				     def gen_mission(self):
			
 
				         # Add a random object to a random room
			
@@ -75,14 +80,21 @@ class KeyCorridor(RoomGridLevel):
 
				     random room.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, num_rows=3, obj_type="ball", room_size=6, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        num_rows=3,
			
 
				+        obj_type="ball",
			
 
				+        room_size=6,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs
			
 
				+    ):
			
 
				         self.obj_type = obj_type
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 30 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				-            room_size=room_size,
			
 
				-            num_rows=num_rows,
			
 
				-            max_steps=30 * room_size**2,
			
 
				-            **kwargs
			
 
				+            room_size=room_size, num_rows=num_rows, max_steps=max_steps, **kwargs
			
 
				         )
			
 
				 
			
 
				     def gen_mission(self):
			
@@ -130,16 +142,17 @@ class MoveTwoAcross(RoomGridLevel):
 
				     instructions.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, room_size, objs_per_room, **kwargs):
			
 
				+    def __init__(
			
 
				+        self, room_size, objs_per_room, max_steps: Optional[int] = None, **kwargs
			
 
				+    ):
			
 
				         assert objs_per_room <= 9
			
 
				         self.objs_per_room = objs_per_room
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 16 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				-            num_rows=1,
			
 
				-            num_cols=2,
			
 
				-            room_size=room_size,
			
 
				-            max_steps=16 * room_size**2,
			
 
				-            **kwargs
			
 
				+            num_rows=1, num_cols=2, room_size=room_size, max_steps=max_steps, **kwargs
			
 
				         )
			
 
				 
			
 
				     def gen_mission(self):
			
--- a/minigrid/envs/babyai/pickup.py
+++ b/minigrid/envs/babyai/pickup.py
@@ -2,6 +2,7 @@
 
				 Copied and adapted from https://github.com/mila-iqia/babyai.
			
 
				 Levels described in the Baby AI ICLR 2019 submission, with the `Pick up` instruction.
			
 
				 """
			
 
				+from typing import Optional
			
 
				 
			
 
				 from minigrid.envs.babyai.core.levelgen import LevelGen
			
 
				 from minigrid.envs.babyai.core.roomgrid_level import RejectSampling, RoomGridLevel
			
@@ -101,9 +102,12 @@ class PickupAbove(RoomGridLevel):
 
				     This task requires to use the compass to be solved effectively.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, **kwargs):
			
 
				+    def __init__(self, max_steps: Optional[int] = None, **kwargs):
			
 
				         room_size = 6
			
 
				-        super().__init__(room_size=room_size, max_steps=8 * room_size**2, **kwargs)
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 8 * room_size**2
			
 
				+
			
 
				+        super().__init__(room_size=room_size, max_steps=max_steps, **kwargs)
			
 
				 
			
 
				     def gen_mission(self):
			
 
				         # Add a random object to the top-middle room
			
--- a/minigrid/envs/babyai/putnext.py
+++ b/minigrid/envs/babyai/putnext.py
@@ -2,6 +2,7 @@
 
				 Copied and adapted from https://github.com/mila-iqia/babyai.
			
 
				 Levels described in the Baby AI ICLR 2019 submission, with the `Put Next` instruction.
			
 
				 """
			
 
				+from typing import Optional
			
 
				 
			
 
				 from minigrid.envs.babyai.core.roomgrid_level import RoomGridLevel
			
 
				 from minigrid.envs.babyai.core.verifier import ObjDesc, PutNextInstr
			
@@ -35,18 +36,24 @@ class PutNext(RoomGridLevel):
 
				     instructions.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, room_size, objs_per_room, start_carrying=False, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        room_size,
			
 
				+        objs_per_room,
			
 
				+        start_carrying=False,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs
			
 
				+    ):
			
 
				         assert room_size >= 4
			
 
				         assert objs_per_room <= 9
			
 
				         self.objs_per_room = objs_per_room
			
 
				         self.start_carrying = start_carrying
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 8 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				-            num_rows=1,
			
 
				-            num_cols=2,
			
 
				-            room_size=room_size,
			
 
				-            max_steps=8 * room_size**2,
			
 
				-            **kwargs
			
 
				+            num_rows=1, num_cols=2, room_size=room_size, max_steps=max_steps, **kwargs
			
 
				         )
			
 
				 
			
 
				     def gen_mission(self):
			
--- a/minigrid/envs/babyai/unlock.py
+++ b/minigrid/envs/babyai/unlock.py
@@ -2,6 +2,7 @@
 
				 Copied and adapted from https://github.com/mila-iqia/babyai.
			
 
				 Levels described in the Baby AI ICLR 2019 submission, with the `Unlock` instruction.
			
 
				 """
			
 
				+from typing import Optional
			
 
				 
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.envs.babyai.core.roomgrid_level import RoomGridLevel
			
@@ -109,16 +110,14 @@ class UnlockPickup(RoomGridLevel):
 
				     Unlock a door, then pick up a box in another room
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, distractors=False, **kwargs):
			
 
				+    def __init__(self, distractors=False, max_steps: Optional[int] = None, **kwargs):
			
 
				         self.distractors = distractors
			
 
				-
			
 
				         room_size = 6
			
 
				+        if max is None:
			
 
				+            max_steps = 8 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				-            num_rows=1,
			
 
				-            num_cols=2,
			
 
				-            room_size=room_size,
			
 
				-            max_steps=8 * room_size**2,
			
 
				-            **kwargs
			
 
				+            num_rows=1, num_cols=2, room_size=6, max_steps=max_steps, **kwargs
			
 
				         )
			
 
				 
			
 
				     def gen_mission(self):
			
@@ -142,14 +141,13 @@ class BlockedUnlockPickup(RoomGridLevel):
 
				     in another room
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, **kwargs):
			
 
				+    def __init__(self, max_steps: Optional[int] = None, **kwargs):
			
 
				         room_size = 6
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 16 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				-            num_rows=1,
			
 
				-            num_cols=2,
			
 
				-            room_size=room_size,
			
 
				-            max_steps=16 * room_size**2,
			
 
				-            **kwargs
			
 
				+            num_rows=1, num_cols=2, room_size=room_size, max_steps=max_steps, **kwargs
			
 
				         )
			
 
				 
			
 
				     def gen_mission(self):
			
@@ -173,14 +171,13 @@ class UnlockToUnlock(RoomGridLevel):
 
				     Unlock a door A that requires to unlock a door B before
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, **kwargs):
			
 
				+    def __init__(self, max_steps: Optional[int] = None, **kwargs):
			
 
				         room_size = 6
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 30 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				-            num_rows=1,
			
 
				-            num_cols=3,
			
 
				-            room_size=room_size,
			
 
				-            max_steps=30 * room_size**2,
			
 
				-            **kwargs
			
 
				+            num_rows=1, num_cols=3, room_size=room_size, max_steps=max_steps, **kwargs
			
 
				         )
			
 
				 
			
 
				     def gen_mission(self):
			
--- a/minigrid/envs/blockedunlockpickup.py
+++ b/minigrid/envs/blockedunlockpickup.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.roomgrid import RoomGrid
			
@@ -63,18 +65,22 @@ class BlockedUnlockPickupEnv(RoomGrid):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, **kwargs):
			
 
				-        room_size = 6
			
 
				+    def __init__(self, max_steps: Optional[int] = None, **kwargs):
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda color, type: f"pick up the {color} {type}",
			
 
				             ordered_placeholders=[COLOR_NAMES, ["box", "key"]],
			
 
				         )
			
 
				+
			
 
				+        room_size = 6
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 16 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             num_rows=1,
			
 
				             num_cols=2,
			
 
				             room_size=room_size,
			
 
				-            max_steps=16 * room_size**2,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/crossing.py
+++ b/minigrid/envs/crossing.py
@@ -1,4 +1,5 @@
 
				 import itertools as itt
			
 
				+from typing import Optional
			
 
				 
			
 
				 import numpy as np
			
 
				 
			
@@ -90,7 +91,14 @@ class CrossingEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=9, num_crossings=1, obstacle_type=Lava, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        size=9,
			
 
				+        num_crossings=1,
			
 
				+        obstacle_type=Lava,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs
			
 
				+    ):
			
 
				         self.num_crossings = num_crossings
			
 
				         self.obstacle_type = obstacle_type
			
 
				 
			
@@ -103,12 +111,14 @@ class CrossingEnv(MiniGridEnv):
 
				                 mission_func=lambda: "find the opening and get to the green goal square"
			
 
				             )
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 4 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             grid_size=size,
			
 
				-            max_steps=4 * size * size,
			
 
				-            # Set this to True for maximum speed
			
 
				-            see_through_walls=False,
			
 
				+            see_through_walls=False,  # Set this to True for maximum speed
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/distshift.py
+++ b/minigrid/envs/distshift.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.world_object import Goal, Lava
			
@@ -70,6 +72,7 @@ class DistShiftEnv(MiniGridEnv):
 
				         agent_start_pos=(1, 1),
			
 
				         agent_start_dir=0,
			
 
				         strip2_row=2,
			
 
				+        max_steps: Optional[int] = None,
			
 
				         **kwargs
			
 
				     ):
			
 
				         self.agent_start_pos = agent_start_pos
			
@@ -81,13 +84,16 @@ class DistShiftEnv(MiniGridEnv):
 
				             mission_func=lambda: "get to the green goal square"
			
 
				         )
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 4 * width * height
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=width,
			
 
				             height=height,
			
 
				-            max_steps=4 * width * height,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=True,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/doorkey.py
+++ b/minigrid/envs/doorkey.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.world_object import Door, Goal, Key
			
@@ -60,13 +62,15 @@ class DoorKeyEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=8, **kwargs):
			
 
				-        if "max_steps" not in kwargs:
			
 
				-            kwargs["max_steps"] = 10 * size * size
			
 
				+    def __init__(self, size=8, max_steps: Optional[int] = None, **kwargs):
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 10 * size**2
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda: "use the key to open the door and then get to the goal"
			
 
				         )
			
 
				-        super().__init__(mission_space=mission_space, grid_size=size, **kwargs)
			
 
				+        super().__init__(
			
 
				+            mission_space=mission_space, grid_size=size, max_steps=max_steps, **kwargs
			
 
				+        )
			
 
				 
			
 
				     def _gen_grid(self, width, height):
			
 
				         # Create an empty grid
			
--- a/minigrid/envs/dynamicobstacles.py
+++ b/minigrid/envs/dynamicobstacles.py
@@ -1,4 +1,5 @@
 
				 from operator import add
			
 
				+from typing import Optional
			
 
				 
			
 
				 from gymnasium.spaces import Discrete
			
 
				 
			
@@ -70,7 +71,13 @@ class DynamicObstaclesEnv(MiniGridEnv):
 
				     """
			
 
				 
			
 
				     def __init__(
			
 
				-        self, size=8, agent_start_pos=(1, 1), agent_start_dir=0, n_obstacles=4, **kwargs
			
 
				+        self,
			
 
				+        size=8,
			
 
				+        agent_start_pos=(1, 1),
			
 
				+        agent_start_dir=0,
			
 
				+        n_obstacles=4,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs
			
 
				     ):
			
 
				         self.agent_start_pos = agent_start_pos
			
 
				         self.agent_start_dir = agent_start_dir
			
@@ -85,12 +92,15 @@ class DynamicObstaclesEnv(MiniGridEnv):
 
				             mission_func=lambda: "get to the green goal square"
			
 
				         )
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 4 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             grid_size=size,
			
 
				-            max_steps=4 * size * size,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=True,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				         # Allow only 3 actions permitted: left, right, forward
			
--- a/minigrid/envs/empty.py
+++ b/minigrid/envs/empty.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.world_object import Goal
			
@@ -65,7 +67,14 @@ class EmptyEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=8, agent_start_pos=(1, 1), agent_start_dir=0, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        size=8,
			
 
				+        agent_start_pos=(1, 1),
			
 
				+        agent_start_dir=0,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs
			
 
				+    ):
			
 
				         self.agent_start_pos = agent_start_pos
			
 
				         self.agent_start_dir = agent_start_dir
			
 
				 
			
@@ -73,12 +82,15 @@ class EmptyEnv(MiniGridEnv):
 
				             mission_func=lambda: "get to the green goal square"
			
 
				         )
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 4 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             grid_size=size,
			
 
				-            max_steps=4 * size * size,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=True,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/fetch.py
+++ b/minigrid/envs/fetch.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
@@ -71,7 +73,7 @@ class FetchEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=8, numObjs=3, **kwargs):
			
 
				+    def __init__(self, size=8, numObjs=3, max_steps: Optional[int] = None, **kwargs):
			
 
				         self.numObjs = numObjs
			
 
				         self.obj_types = ["key", "ball"]
			
 
				 
			
@@ -87,13 +89,17 @@ class FetchEnv(MiniGridEnv):
 
				             mission_func=lambda syntax, color, type: f"{syntax} {color} {type}",
			
 
				             ordered_placeholders=[MISSION_SYNTAX, COLOR_NAMES, self.obj_types],
			
 
				         )
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 5 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=size,
			
 
				             height=size,
			
 
				-            max_steps=5 * size**2,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=True,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/fourrooms.py
+++ b/minigrid/envs/fourrooms.py
@@ -57,7 +57,7 @@ class FourRoomsEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, agent_pos=None, goal_pos=None, **kwargs):
			
 
				+    def __init__(self, agent_pos=None, goal_pos=None, max_steps=100, **kwargs):
			
 
				         self._agent_default_pos = agent_pos
			
 
				         self._goal_default_pos = goal_pos
			
 
				 
			
@@ -68,7 +68,7 @@ class FourRoomsEnv(MiniGridEnv):
 
				             mission_space=mission_space,
			
 
				             width=self.size,
			
 
				             height=self.size,
			
 
				-            max_steps=100,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/gotodoor.py
+++ b/minigrid/envs/gotodoor.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
@@ -63,20 +65,24 @@ class GoToDoorEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=5, **kwargs):
			
 
				+    def __init__(self, size=5, max_steps: Optional[int] = None, **kwargs):
			
 
				         assert size >= 5
			
 
				         self.size = size
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda color: f"go to the {color} door",
			
 
				             ordered_placeholders=[COLOR_NAMES],
			
 
				         )
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 4 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=size,
			
 
				             height=size,
			
 
				-            max_steps=5 * size**2,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=True,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/gotoobject.py
+++ b/minigrid/envs/gotoobject.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
@@ -11,7 +13,8 @@ class GoToObjectEnv(MiniGridEnv):
 
				     named using an English text string
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=6, numObjs=2, **kwargs):
			
 
				+    def __init__(self, size=6, numObjs=2, max_steps: Optional[int] = None, **kwargs):
			
 
				+
			
 
				         self.numObjs = numObjs
			
 
				         self.size = size
			
 
				         # Types of objects to be generated
			
@@ -21,13 +24,17 @@ class GoToObjectEnv(MiniGridEnv):
 
				             mission_func=lambda color, type: f"go to the {color} {type}",
			
 
				             ordered_placeholders=[COLOR_NAMES, self.obj_types],
			
 
				         )
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 5 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=size,
			
 
				             height=size,
			
 
				-            max_steps=5 * size**2,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=True,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/keycorridor.py
+++ b/minigrid/envs/keycorridor.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.roomgrid import RoomGrid
			
@@ -77,17 +79,28 @@ class KeyCorridorEnv(RoomGrid):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, num_rows=3, obj_type="ball", room_size=6, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        num_rows=3,
			
 
				+        obj_type="ball",
			
 
				+        room_size=6,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs,
			
 
				+    ):
			
 
				         self.obj_type = obj_type
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda color: f"pick up the {color} {obj_type}",
			
 
				             ordered_placeholders=[COLOR_NAMES],
			
 
				         )
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 30 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             room_size=room_size,
			
 
				             num_rows=num_rows,
			
 
				-            max_steps=30 * room_size**2,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/lavagap.py
+++ b/minigrid/envs/lavagap.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 import numpy as np
			
 
				 
			
 
				 from minigrid.core.grid import Grid
			
@@ -66,7 +68,9 @@ class LavaGapEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size, obstacle_type=Lava, **kwargs):
			
 
				+    def __init__(
			
 
				+        self, size, obstacle_type=Lava, max_steps: Optional[int] = None, **kwargs
			
 
				+    ):
			
 
				         self.obstacle_type = obstacle_type
			
 
				         self.size = size
			
 
				 
			
@@ -79,13 +83,16 @@ class LavaGapEnv(MiniGridEnv):
 
				                 mission_func=lambda: "find the opening and get to the green goal square"
			
 
				             )
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 4 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=size,
			
 
				             height=size,
			
 
				-            max_steps=4 * size * size,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=False,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/lockedroom.py
+++ b/minigrid/envs/lockedroom.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
@@ -74,8 +76,11 @@ class LockedRoomEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=19, **kwargs):
			
 
				+    def __init__(self, size=19, max_steps: Optional[int] = None, **kwargs):
			
 
				         self.size = size
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 10 * size
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda lockedroom_color, keyroom_color, door_color: f"get the {lockedroom_color} key from the {keyroom_color} room, unlock the {door_color} door and go to the goal",
			
 
				             ordered_placeholders=[COLOR_NAMES] * 3,
			
@@ -84,7 +89,7 @@ class LockedRoomEnv(MiniGridEnv):
 
				             mission_space=mission_space,
			
 
				             width=size,
			
 
				             height=size,
			
 
				-            max_steps=10 * size,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/memory.py
+++ b/minigrid/envs/memory.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 import numpy as np
			
 
				 
			
 
				 from minigrid.core.actions import Actions
			
@@ -65,9 +67,15 @@ class MemoryEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=8, random_length=False, **kwargs):
			
 
				+    def __init__(
			
 
				+        self, size=8, random_length=False, max_steps: Optional[int] = None, **kwargs
			
 
				+    ):
			
 
				         self.size = size
			
 
				         self.random_length = random_length
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 5 * size**2
			
 
				+
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda: "go to the matching object at the end of the hallway"
			
 
				         )
			
@@ -75,9 +83,9 @@ class MemoryEnv(MiniGridEnv):
 
				             mission_space=mission_space,
			
 
				             width=size,
			
 
				             height=size,
			
 
				-            max_steps=5 * size**2,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=False,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/multiroom.py
+++ b/minigrid/envs/multiroom.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
@@ -72,7 +74,14 @@ class MultiRoomEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, minNumRooms, maxNumRooms, maxRoomSize=10, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        minNumRooms,
			
 
				+        maxNumRooms,
			
 
				+        maxRoomSize=10,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs
			
 
				+    ):
			
 
				         assert minNumRooms > 0
			
 
				         assert maxNumRooms >= minNumRooms
			
 
				         assert maxRoomSize >= 4
			
@@ -89,11 +98,14 @@ class MultiRoomEnv(MiniGridEnv):
 
				 
			
 
				         self.size = 25
			
 
				 
			
 
				+        if max_steps is None:
			
 
				+            max_steps = maxNumRooms * 20
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=self.size,
			
 
				             height=self.size,
			
 
				-            max_steps=self.maxNumRooms * 20,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/obstructedmaze.py
+++ b/minigrid/envs/obstructedmaze.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES, DIR_TO_VEC
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.roomgrid import RoomGrid
			
@@ -79,9 +81,18 @@ class ObstructedMazeEnv(RoomGrid):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, num_rows, num_cols, num_rooms_visited, **kwargs):
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        num_rows,
			
 
				+        num_cols,
			
 
				+        num_rooms_visited,
			
 
				+        max_steps: Optional[int] = None,
			
 
				+        **kwargs,
			
 
				+    ):
			
 
				         room_size = 6
			
 
				-        max_steps = 4 * num_rooms_visited * room_size**2
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 4 * num_rooms_visited * room_size**2
			
 
				 
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda: f"pick up the {COLOR_NAMES[0]} ball",
			
--- a/minigrid/envs/playground.py
+++ b/minigrid/envs/playground.py
@@ -11,14 +11,14 @@ class PlaygroundEnv(MiniGridEnv):
 
				     This environment has no specific goals or rewards.
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, **kwargs):
			
 
				+    def __init__(self, max_steps=100, **kwargs):
			
 
				         mission_space = MissionSpace(mission_func=lambda: "")
			
 
				         self.size = 19
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=self.size,
			
 
				             height=self.size,
			
 
				-            max_steps=100,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/putnear.py
+++ b/minigrid/envs/putnear.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
@@ -65,7 +67,7 @@ class PutNearEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=6, numObjs=2, **kwargs):
			
 
				+    def __init__(self, size=6, numObjs=2, max_steps: Optional[int] = None, **kwargs):
			
 
				         self.size = size
			
 
				         self.numObjs = numObjs
			
 
				         self.obj_types = ["key", "ball", "box"]
			
@@ -78,13 +80,17 @@ class PutNearEnv(MiniGridEnv):
 
				                 self.obj_types,
			
 
				             ],
			
 
				         )
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 5 * size
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=size,
			
 
				             height=size,
			
 
				-            max_steps=5 * size,
			
 
				             # Set this to True for maximum speed
			
 
				             see_through_walls=True,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/redbluedoors.py
+++ b/minigrid/envs/redbluedoors.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.grid import Grid
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.world_object import Door
			
@@ -57,16 +59,20 @@ class RedBlueDoorEnv(MiniGridEnv):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, size=8, **kwargs):
			
 
				+    def __init__(self, size=8, max_steps: Optional[int] = None, **kwargs):
			
 
				         self.size = size
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda: "open the red door then the blue door"
			
 
				         )
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 20 * size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             width=2 * size,
			
 
				             height=size,
			
 
				-            max_steps=20 * size * size,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/unlock.py
+++ b/minigrid/envs/unlock.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.roomgrid import RoomGrid
			
 
				 
			
@@ -53,15 +55,19 @@ class UnlockEnv(RoomGrid):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, **kwargs):
			
 
				+    def __init__(self, max_steps: Optional[int] = None, **kwargs):
			
 
				         room_size = 6
			
 
				         mission_space = MissionSpace(mission_func=lambda: "open the door")
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 8 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             num_rows=1,
			
 
				             num_cols=2,
			
 
				             room_size=room_size,
			
 
				-            max_steps=8 * room_size**2,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs
			
 
				         )
			
 
				 
			
--- a/minigrid/envs/unlockpickup.py
+++ b/minigrid/envs/unlockpickup.py
@@ -1,3 +1,5 @@
 
				+from typing import Optional
			
 
				+
			
 
				 from minigrid.core.constants import COLOR_NAMES
			
 
				 from minigrid.core.mission import MissionSpace
			
 
				 from minigrid.core.roomgrid import RoomGrid
			
@@ -57,18 +59,22 @@ class UnlockPickupEnv(RoomGrid):
 
				 
			
 
				     """
			
 
				 
			
 
				-    def __init__(self, **kwargs):
			
 
				+    def __init__(self, max_steps: Optional[int] = None, **kwargs):
			
 
				         room_size = 6
			
 
				         mission_space = MissionSpace(
			
 
				             mission_func=lambda color: f"pick up the {color} box",
			
 
				             ordered_placeholders=[COLOR_NAMES],
			
 
				         )
			
 
				+
			
 
				+        if max_steps is None:
			
 
				+            max_steps = 8 * room_size**2
			
 
				+
			
 
				         super().__init__(
			
 
				             mission_space=mission_space,
			
 
				             num_rows=1,
			
 
				             num_cols=2,
			
 
				             room_size=room_size,
			
 
				-            max_steps=8 * room_size**2,
			
 
				+            max_steps=max_steps,
			
 
				             **kwargs,
			
 
				         )
			
 
				 
			
--- a/minigrid/minigrid_env.py
+++ b/minigrid/minigrid_env.py
@@ -903,7 +903,12 @@ class MiniGridEnv(gym.Env):
 
				         # Environment configuration
			
 
				         self.width = width
			
 
				         self.height = height
			
 
				+
			
 
				+        assert isinstance(
			
 
				+            max_steps, int
			
 
				+        ), f"The argument max_steps must be an integer, got: {type(max_steps)}"
			
 
				         self.max_steps = max_steps
			
 
				+
			
 
				         self.see_through_walls = see_through_walls
			
 
				 
			
 
				         # Current position and direction of the agent
			
--- a/tests/test_envs.py
+++ b/tests/test_envs.py
@@ -142,6 +142,29 @@ def test_agent_sees_method(env_id):
 
				 @pytest.mark.parametrize(
			
 
				     "env_spec", all_testing_env_specs, ids=[spec.id for spec in all_testing_env_specs]
			
 
				 )
			
 
				+def test_max_steps_argument(env_spec):
			
 
				+    """
			
 
				+    Test that when initializing an environment with a fixed number of steps per episode (`max_steps` argument),
			
 
				+    the episode will be truncated after taking that number of steps.
			
 
				+    """
			
 
				+    max_steps = 50
			
 
				+    env = env_spec.make(max_steps=max_steps)
			
 
				+    env.reset()
			
 
				+    step_count = 0
			
 
				+    while True:
			
 
				+        _, _, terminated, truncated, _ = env.step(4)
			
 
				+        step_count += 1
			
 
				+        if truncated:
			
 
				+            assert step_count == max_steps
			
 
				+            step_count = 0
			
 
				+            break
			
 
				+
			
 
				+    env.close()
			
 
				+
			
 
				+
			
 
				+@pytest.mark.parametrize(
			
 
				+    "env_spec", all_testing_env_specs, ids=[spec.id for spec in all_testing_env_specs]
			
 
				+)
			
 
				 def old_run_test(env_spec):
			
 
				     # Load the gym environment
			
 
				     env = env_spec.make()