Commit History

Автор SHA1 Съобщение Дата
  Kai Wu 2ea7f57991 convertion missing preprocessor_config.json. преди 7 месеца
  Matthias Reso e2f77dbc21 fix quant config преди 10 месеца
  Matthias Reso 6ef9a78458 Fix issues with quantization_config == None преди 10 месеца
  Matthias Reso 0920b1a415 Fix quantization for inference преди 10 месеца
  Hamid Shojanazeri d51d2cce9c adding sdpa for flash attn преди 1 година
  Hamid Shojanazeri db8af96ff0 update the model load with native flash attn преди 1 година
  Matthias Reso 4c9cc7d223 Move modules into separate src folder преди 1 година