Allen преди 1 година
родител
ревизия
cedb89b064
променени са 1 файла, в които са добавени 2 реда и са изтрити 2 реда
  1. 2 2
      research/long-context-llama/H2O/generation.py

+ 2 - 2
research/long-context-llama/H2O/generation.py

@@ -33,8 +33,8 @@ if __name__ == '__main__':
     parser.add_argument("--model-name", type=str, default="")
 
     parser.add_argument("--enable_h2o_generation", action='store_true')
-    parser.add_argument("--num_heavy_hitter_tokens", type=int, default=256)
-    parser.add_argument("--num_window_length", type=int, default=512)
+    parser.add_argument("--num_heavy_hitter_tokens", type=int, default=128)
+    parser.add_argument("--num_window_length", type=int, default=256)
 
     parser.add_argument("--enable_position_rolling", action='store_true')