Kai Wu
|
2ea7f57991
convertion missing preprocessor_config.json.
|
před 7 měsíci |
Matthias Reso
|
e2f77dbc21
fix quant config
|
před 10 měsíci |
Matthias Reso
|
6ef9a78458
Fix issues with quantization_config == None
|
před 10 měsíci |
Matthias Reso
|
0920b1a415
Fix quantization for inference
|
před 10 měsíci |
Hamid Shojanazeri
|
d51d2cce9c
adding sdpa for flash attn
|
před 1 rokem |
Hamid Shojanazeri
|
db8af96ff0
update the model load with native flash attn
|
před 1 rokem |
Matthias Reso
|
4c9cc7d223
Move modules into separate src folder
|
před 1 rokem |