Historie revizí

Autor SHA1 Zpráva Datum
  Matthias Reso 113ea18bf1 Replace LlamaTokenizer with AutoTokenizer před 11 měsíci
  Hamid Shojanazeri 11f51db28c adding the kbit prep in the code před 11 měsíci
  Hamid Shojanazeri f058ff6ccd update due to peft new release před 11 měsíci
  Hamid Shojanazeri ffdc93f00a Merge branch 'main' into wandb_logging před 1 rokem
  Matthias Reso c5a382e509 Make tests run on cpu only machines před 1 rokem
  Hamid Shojanazeri 43ea6bfa71 Merge branch 'main' into ssdp před 1 rokem
  Hamid Shojanazeri d51d2cce9c adding sdpa for flash attn před 1 rokem
  Hamid Shojanazeri 9a2434f408 update the fine-tuning script před 1 rokem
  Hamid Shojanazeri 162be4c045 Revert "Flop counter, profiling and GC (#357)" před 1 rokem
  Hamid Shojanazeri 71d137c722 Merge branch 'main' into flop_counter_gc před 1 rokem
  Less Wright 3f2c33e4f8 Update finetuning.py - remove nightly check před 1 rokem
  Hamid Shojanazeri b15ffeeaf4 clean up před 1 rokem
  Hamid Shojanazeri 19089269d3 add gc před 1 rokem
  kldarek 989b6ee812 wandb logging feedback před 1 rokem
  Abhilash Majumder 4793f0fdf3 Merge branch 'main' into ipex_feature před 1 rokem
  kldarek fc5485d916 fixing wandb for fsdp před 1 rokem
  kldarek f2406cac07 cleanup spaces před 1 rokem
  kldarek cf373529f7 basic wandb logging instrumentation před 1 rokem
  Hamid Shojanazeri aa24e8f57e fix typos před 1 rokem
  Hamid Shojanazeri 38c8cf08c4 adding hsdp před 1 rokem
  Abhilash Majumder 6a78b96764 Merge branch 'main' into ipex_feature před 1 rokem
  Matthias Reso 4c225c65eb Fix order of concat vs sampler před 1 rokem
  Matthias Reso 5da84b2913 Fix usage of dataclass for train_config and fsdp_config před 1 rokem
  Matthias Reso 653a79e3dd Invalidate context in labels for samsum + grammar před 1 rokem
  Matthias Reso a647955fc8 Make packing/padding a training setting před 1 rokem
  Matthias Reso 2e4bd2a665 Resize vocab size to fix idx error před 1 rokem
  Matthias Reso ca41c1c697 Adjust tests to len based batch sampling před 1 rokem
  Shijie Wu 91e2573aa8 pass weight_decay into optimizer před 1 rokem
  Howard Liberty cc356b6017 Add FSDP CPU offloading option před 1 rokem
  abhilash1910 ad6b27d316 merge conflicts před 1 rokem