Аутор | SHA1 Порука | Датум |
---|---|---|
|
9def4fbafd Remove micro_batch_training parameter and replace with gradient_accumulation_steps | пре 2 година |
|
3faf005226 fix a bug in the config for use_fast_kernels | пре 2 година |
|
feaa344af3 resolve conflicts | пре 2 година |
|
44ef280d31 adding flash attention and xformer memory efficient through PT SDPA | пре 2 година |
|
895dfcea30 add nightly check for using low_cpu_fsdp mode | пре 2 година |
|
4767f09ecd Initial commit | пре 2 година |