Allen 1 год назад
Родитель
Сommit
36109c8b46
1 измененных файлов с 1 добавлено и 1 удалено
  1. 1 1
      research/long-context-llama/H2O/utils_llama.py

+ 1 - 1
research/long-context-llama/H2O/utils_llama.py

@@ -187,7 +187,7 @@ class H2OLlamaAttention(nn.Module):
                 query_position_ids = position_ids
                 key_position_ids = position_ids
 
-            cos, sin = self.rotary_emb(value_states, kv_seq_len)
+            cos, sin = self.rotary_emb(value_states, key_position_ids)
 
             if self.layer_idx == 0:
                 print(kv_seq_len, query_position_ids, key_position_ids)