6 年之前 · f974ed96cc
--- a/train_classifier_bow.py
+++ b/train_classifier_bow.py
@@ -42,20 +42,16 @@ def init_weights(m):
 
				         m.bias.data.fill_(0)
			
 
				 
			
 
				 class ImageBOWEmbedding(nn.Module):
			
 
				-    def __init__(self, num_embeddings, embedding_dim, padding_idx=None, reduce_fn=torch.mean):
			
 
				-        super(ImageBOWEmbedding, self).__init__()
			
 
				-        self.num_embeddings = num_embeddings
			
 
				-        self.embedding_dim = embedding_dim
			
 
				-        self.padding_idx = padding_idx
			
 
				-        self.reduce_fn = reduce_fn
			
 
				-        self.embedding = nn.Embedding(num_embeddings, embedding_dim, padding_idx=padding_idx)
			
 
				-
			
 
				-    def forward(self, inputs):
			
 
				-        embeddings = self.embedding(inputs.long())
			
 
				-        embeddings = self.reduce_fn(embeddings, dim=1)
			
 
				-        embeddings = torch.transpose(embeddings, 1, 3)
			
 
				-        embeddings = torch.transpose(embeddings, 2, 3)
			
 
				-        return embeddings
			
 
				+   def __init__(self, max_value, embedding_dim):
			
 
				+       super(ImageBOWEmbedding, self).__init__()
			
 
				+       self.max_value = max_value
			
 
				+       self.embedding_dim = embedding_dim
			
 
				+       self.embedding = nn.Embedding(3 * max_value, embedding_dim)
			
 
				+
			
 
				+   def forward(self, inputs):
			
 
				+       offsets = torch.Tensor([0, self.max_value, 2 * self.max_value]).to(inputs.device)
			
 
				+       inputs = (inputs + offsets[None, :, None, None]).long()
			
 
				+       return self.embedding(inputs).sum(1).permute(0, 3, 1, 2)
			
 
				 
			
 
				 class Flatten(nn.Module):
			
 
				     """
			
@@ -65,14 +61,23 @@ class Flatten(nn.Module):
 
				     def forward(self, input):
			
 
				         return input.view(input.size(0), -1)
			
 
				 
			
 
				+def num_params(model):
			
 
				+    pp=0
			
 
				+    for p in list(model.parameters()):
			
 
				+        nn=1
			
 
				+        for s in list(p.size()):
			
 
				+            nn = nn*s
			
 
				+        pp += nn
			
 
				+    return pp
			
 
				+
			
 
				 class Model(nn.Module):
			
 
				     def __init__(self):
			
 
				         super().__init__()
			
 
				 
			
 
				         self.layers = nn.Sequential(
			
 
				-            ImageBOWEmbedding(765, embedding_dim=16, padding_idx=0, reduce_fn=torch.mean),
			
 
				+            ImageBOWEmbedding(765, embedding_dim=32),
			
 
				 
			
 
				-            nn.Conv2d(in_channels=16, out_channels=64, kernel_size=1),
			
 
				+            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=1),
			
 
				             nn.LeakyReLU(),
			
 
				             nn.Conv2d(in_channels=64, out_channels=64, kernel_size=1),
			
 
				             nn.LeakyReLU(),
			
@@ -91,7 +96,7 @@ class Model(nn.Module):
 
				         self.apply(init_weights)
			
 
				 
			
 
				     def forward(self, obs):
			
 
				-        obs = obs / 16
			
 
				+        #obs = obs / 16
			
 
				 
			
 
				         out = self.layers(obs)
			
 
				 
			
@@ -137,8 +142,6 @@ def sample_batch(batch_size=128):
 
				 
			
 
				 
			
 
				 
			
 
				-
			
 
				-
			
 
				 print('Generating test set')
			
 
				 test_imgs, test_labels = sample_batch(256)
			
 
				 
			
@@ -181,6 +184,8 @@ batch_size = 128
 
				 model = Model()
			
 
				 model.cuda()
			
 
				 
			
 
				+print('Num params:', num_params(model))
			
 
				+
			
 
				 optimizer = optim.Adam(
			
 
				     model.parameters(),
			
 
				     lr=5e-4
			
--- a/train_classifier_img.py
+++ b/train_classifier_img.py
@@ -8,6 +8,8 @@ from gym_minigrid.register import env_list
 
				 from gym_minigrid.minigrid import Grid, OBJECT_TO_IDX
			
 
				 import babyai
			
 
				 
			
 
				+import matplotlib.pyplot as plt
			
 
				+
			
 
				 import torch
			
 
				 import torch.nn as nn
			
 
				 import torch.optim as optim
			
@@ -41,21 +43,14 @@ def init_weights(m):
 
				         m.weight.data.normal_(1.0, 0.02)
			
 
				         m.bias.data.fill_(0)
			
 
				 
			
 
				-class ImageBOWEmbedding(nn.Module):
			
 
				-    def __init__(self, num_embeddings, embedding_dim, padding_idx=None, reduce_fn=torch.mean):
			
 
				-        super(ImageBOWEmbedding, self).__init__()
			
 
				-        self.num_embeddings = num_embeddings
			
 
				-        self.embedding_dim = embedding_dim
			
 
				-        self.padding_idx = padding_idx
			
 
				-        self.reduce_fn = reduce_fn
			
 
				-        self.embedding = nn.Embedding(num_embeddings, embedding_dim, padding_idx=padding_idx)
			
 
				-
			
 
				-    def forward(self, inputs):
			
 
				-        embeddings = self.embedding(inputs.long())
			
 
				-        embeddings = self.reduce_fn(embeddings, dim=1)
			
 
				-        embeddings = torch.transpose(embeddings, 1, 3)
			
 
				-        embeddings = torch.transpose(embeddings, 2, 3)
			
 
				-        return embeddings
			
 
				+def num_params(model):
			
 
				+    pp=0
			
 
				+    for p in list(model.parameters()):
			
 
				+        nn=1
			
 
				+        for s in list(p.size()):
			
 
				+            nn = nn*s
			
 
				+        pp += nn
			
 
				+    return pp
			
 
				 
			
 
				 class Flatten(nn.Module):
			
 
				     """
			
@@ -80,11 +75,11 @@ class Model(nn.Module):
 
				             #nn.Conv2d(in_channels=16, out_channels=64, kernel_size=1),
			
 
				             #nn.LeakyReLU(),
			
 
				 
			
 
				-            nn.Conv2d(in_channels=3, out_channels=64, kernel_size=6, stride=2),
			
 
				+            nn.Conv2d(in_channels=3, out_channels=16, kernel_size=6, stride=2),
			
 
				             nn.LeakyReLU(),
			
 
				-            nn.Conv2d(in_channels=64, out_channels=64, kernel_size=6, stride=2),
			
 
				+            nn.Conv2d(in_channels=16, out_channels=16, kernel_size=6, stride=2),
			
 
				             nn.LeakyReLU(),
			
 
				-            nn.Conv2d(in_channels=64, out_channels=16, kernel_size=6, stride=2),
			
 
				+            nn.Conv2d(in_channels=16, out_channels=16, kernel_size=6, stride=2),
			
 
				             nn.LeakyReLU(),
			
 
				 
			
 
				             #Print(),
			
@@ -129,6 +124,10 @@ def sample_batch(batch_size=128):
 
				         ball_visible = ('red', 'ball') in Grid.decode(obs)
			
 
				 
			
 
				         obs = env.get_obs_render(obs, tile_size=8, mode='rgb_array')
			
 
				+
			
 
				+        #plt.imshow(obs)
			
 
				+        #plt.show()
			
 
				+
			
 
				         obs = obs.transpose([2, 0, 1])
			
 
				 
			
 
				         imgs.append(np.copy(obs))
			
@@ -184,6 +183,8 @@ batch_size = 64
 
				 model = Model()
			
 
				 model.cuda()
			
 
				 
			
 
				+print('Num params:', num_params(model))
			
 
				+
			
 
				 optimizer = optim.Adam(
			
 
				     model.parameters(),
			
 
				     lr=5e-4