Historie revizí

Autor SHA1 Zpráva Datum
  Matthias Reso 53fd82355f Add missing changes před 1 rokem
  Matthias Reso 07bcffbf50 clean up unit tests + add batching test před 1 rokem
  Matthias Reso 4c225c65eb Fix order of concat vs sampler před 1 rokem
  Matthias Reso f9756ca79d Added packing test for samsum před 1 rokem
  Matthias Reso 5a359b7bf2 Fix sampler vs batch_sampler před 1 rokem
  Matthias Reso fe8122daf1 Adapt alpaca dataset to ConcatDataset před 1 rokem
  Matthias Reso 5da84b2913 Fix usage of dataclass for train_config and fsdp_config před 1 rokem
  Matthias Reso aa5dee241a Fix unit test to reflect batch packing před 1 rokem
  Matthias Reso 8620ab8ac2 Fix invalid labels for context in custom dataset/oasst1 před 1 rokem
  Matthias Reso 52c417b7d5 Merge branch 'fix/invalidate_label_for_chat' into feature/length_based_batch_sampling před 1 rokem
  Matthias Reso 653a79e3dd Invalidate context in labels for samsum + grammar před 1 rokem
  Matthias Reso d3015b4c80 Remove max_word from alpaca; lets deal tokenizer deal with truncation před 1 rokem
  Matthias Reso a647955fc8 Make packing/padding a training setting před 1 rokem
  Matthias Reso eafea7b366 Invalidate labels in dialog dataset to disable loss před 1 rokem
  Matthias Reso cc8cc0d3c3 fix grammar dataset před 1 rokem
  Matthias Reso 2e4bd2a665 Resize vocab size to fix idx error před 1 rokem
  Matthias Reso 10f9367e56 fix missing labels in datasets před 1 rokem
  Matthias Reso f2d02a9362 Add unit test for dis sampler před 1 rokem
  Matthias Reso be63d9ec39 Remove padding in alpaca ds; remove concat in grammar před 1 rokem
  Matthias Reso ddf58d205d Added dist length based batch sampler před 1 rokem
  Matthias Reso ca41c1c697 Adjust tests to len based batch sampling před 1 rokem
  Matthias Reso 97a7871f4b Fix seed in test před 1 rokem
  Matthias Reso 17209cdabd Add license to test file před 1 rokem
  Matthias Reso d5054ecae9 Move sampler test před 1 rokem
  Matthias Reso 63ce4ce7f6 Moved sampler to data submodule před 1 rokem
  Matthias Reso f620f3589d Adds length based batch sampler před 1 rokem
  Matthias Reso 8ac44ef3be Fix vocab size mismatch in inference due to added pad token před 1 rokem
  Geeta Chauhan 40b32ba559 Fix tqdm bar not change length after terminal is resized (#201) před 1 rokem
  hongbo.mo 6217635e87 Fix tqdm bar not change length after terminal is resized před 1 rokem
  Matthias Reso 0b2fa40dba Add unit test for weight decay před 1 rokem