Historial de Commits

Autor SHA1 Mensaje Fecha
  Matthias Reso 5da84b2913 Fix usage of dataclass for train_config and fsdp_config hace 2 años
  Matthias Reso aa5dee241a Fix unit test to reflect batch packing hace 2 años
  Matthias Reso 8620ab8ac2 Fix invalid labels for context in custom dataset/oasst1 hace 2 años
  Matthias Reso 52c417b7d5 Merge branch 'fix/invalidate_label_for_chat' into feature/length_based_batch_sampling hace 2 años
  Matthias Reso 653a79e3dd Invalidate context in labels for samsum + grammar hace 2 años
  Matthias Reso d3015b4c80 Remove max_word from alpaca; lets deal tokenizer deal with truncation hace 2 años
  Matthias Reso a647955fc8 Make packing/padding a training setting hace 2 años
  Matthias Reso eafea7b366 Invalidate labels in dialog dataset to disable loss hace 2 años
  Matthias Reso cc8cc0d3c3 fix grammar dataset hace 2 años
  Matthias Reso 2e4bd2a665 Resize vocab size to fix idx error hace 2 años
  Matthias Reso 10f9367e56 fix missing labels in datasets hace 2 años
  Matthias Reso f2d02a9362 Add unit test for dis sampler hace 2 años
  Matthias Reso be63d9ec39 Remove padding in alpaca ds; remove concat in grammar hace 2 años
  Matthias Reso ddf58d205d Added dist length based batch sampler hace 2 años
  Matthias Reso ca41c1c697 Adjust tests to len based batch sampling hace 2 años
  Matthias Reso 97a7871f4b Fix seed in test hace 2 años
  Matthias Reso 17209cdabd Add license to test file hace 2 años
  Matthias Reso d5054ecae9 Move sampler test hace 2 años
  Matthias Reso 63ce4ce7f6 Moved sampler to data submodule hace 2 años
  Matthias Reso f620f3589d Adds length based batch sampler hace 2 años
  Matthias Reso 8ac44ef3be Fix vocab size mismatch in inference due to added pad token hace 2 años
  Geeta Chauhan 40b32ba559 Fix tqdm bar not change length after terminal is resized (#201) hace 2 años
  hongbo.mo 6217635e87 Fix tqdm bar not change length after terminal is resized hace 2 años
  Matthias Reso 0b2fa40dba Add unit test for weight decay hace 2 años
  Shijie Wu 91e2573aa8 pass weight_decay into optimizer hace 2 años
  Hamid Shojanazeri c38bf5bdd3 Add FSDP CPU offloading option (#122) hace 2 años
  Howard Liberty cc356b6017 Add FSDP CPU offloading option hace 2 años
  Yuanhao e554c1c8bf The tokenizer will not add eos_token by default hace 2 años
  tim-a-davis 3038020aa4 Replaced ClassVar config param with field hace 2 años
  Hamid Shojanazeri cfacee4302 Update LLM_finetuning.md hace 2 años