Commit History

Auteur SHA1 Bericht Datum
  Matthias Reso 653a79e3dd Invalidate context in labels for samsum + grammar 1 jaar geleden
  Matthias Reso d3015b4c80 Remove max_word from alpaca; lets deal tokenizer deal with truncation 1 jaar geleden
  Matthias Reso a647955fc8 Make packing/padding a training setting 1 jaar geleden
  Matthias Reso cc8cc0d3c3 fix grammar dataset 2 jaren geleden
  Matthias Reso 2e4bd2a665 Resize vocab size to fix idx error 2 jaren geleden
  Matthias Reso 10f9367e56 fix missing labels in datasets 2 jaren geleden
  Matthias Reso f2d02a9362 Add unit test for dis sampler 2 jaren geleden
  Matthias Reso be63d9ec39 Remove padding in alpaca ds; remove concat in grammar 2 jaren geleden
  Matthias Reso ddf58d205d Added dist length based batch sampler 2 jaren geleden
  Matthias Reso ca41c1c697 Adjust tests to len based batch sampling 2 jaren geleden
  Matthias Reso 97a7871f4b Fix seed in test 2 jaren geleden
  Matthias Reso 17209cdabd Add license to test file 2 jaren geleden
  Matthias Reso d5054ecae9 Move sampler test 2 jaren geleden
  Matthias Reso 63ce4ce7f6 Moved sampler to data submodule 2 jaren geleden
  Matthias Reso f620f3589d Adds length based batch sampler 2 jaren geleden
  Matthias Reso 8ac44ef3be Fix vocab size mismatch in inference due to added pad token 2 jaren geleden
  Geeta Chauhan 40b32ba559 Fix tqdm bar not change length after terminal is resized (#201) 2 jaren geleden
  hongbo.mo 6217635e87 Fix tqdm bar not change length after terminal is resized 2 jaren geleden
  Matthias Reso 0b2fa40dba Add unit test for weight decay 2 jaren geleden
  Shijie Wu 91e2573aa8 pass weight_decay into optimizer 2 jaren geleden
  Hamid Shojanazeri c38bf5bdd3 Add FSDP CPU offloading option (#122) 2 jaren geleden
  Howard Liberty cc356b6017 Add FSDP CPU offloading option 2 jaren geleden
  Yuanhao e554c1c8bf The tokenizer will not add eos_token by default 2 jaren geleden
  tim-a-davis 3038020aa4 Replaced ClassVar config param with field 2 jaren geleden
  Hamid Shojanazeri cfacee4302 Update LLM_finetuning.md 2 jaren geleden
  Hamid Shojanazeri 62dd2b3f4b Update docs/LLM_finetuning.md 2 jaren geleden
  varunfb 6f2201c655 Updated spell checker to resolve the issues in LLM_finetuning.md 2 jaren geleden
  varunfb 2c1ecba170 Update LLM_finetuning.md 2 jaren geleden
  Geeta Chauhan 279f4d4a0b Use OpenAssistent/oasst1 dataset for custom dataset example (#180) 2 jaren geleden
  Kautilya Kondragunta b4c71bebee Update chat_completion.py 2 jaren geleden