Commit History

Autor SHA1 Mensaxe Data
  Matthias Reso 113ea18bf1 Replace LlamaTokenizer with AutoTokenizer hai 11 meses
  Hamid Shojanazeri 11f51db28c adding the kbit prep in the code hai 11 meses
  Hamid Shojanazeri f058ff6ccd update due to peft new release hai 11 meses
  Hamid Shojanazeri ffdc93f00a Merge branch 'main' into wandb_logging hai 1 ano
  Matthias Reso c5a382e509 Make tests run on cpu only machines hai 1 ano
  Hamid Shojanazeri 43ea6bfa71 Merge branch 'main' into ssdp hai 1 ano
  Hamid Shojanazeri d51d2cce9c adding sdpa for flash attn hai 1 ano
  Hamid Shojanazeri 9a2434f408 update the fine-tuning script hai 1 ano
  Hamid Shojanazeri 162be4c045 Revert "Flop counter, profiling and GC (#357)" hai 1 ano
  Hamid Shojanazeri 71d137c722 Merge branch 'main' into flop_counter_gc hai 1 ano
  Less Wright 3f2c33e4f8 Update finetuning.py - remove nightly check hai 1 ano
  Hamid Shojanazeri b15ffeeaf4 clean up hai 1 ano
  Hamid Shojanazeri 19089269d3 add gc hai 1 ano
  kldarek 989b6ee812 wandb logging feedback hai 1 ano
  Abhilash Majumder 4793f0fdf3 Merge branch 'main' into ipex_feature hai 1 ano
  kldarek fc5485d916 fixing wandb for fsdp hai 1 ano
  kldarek f2406cac07 cleanup spaces hai 1 ano
  kldarek cf373529f7 basic wandb logging instrumentation hai 1 ano
  Hamid Shojanazeri aa24e8f57e fix typos hai 1 ano
  Hamid Shojanazeri 38c8cf08c4 adding hsdp hai 1 ano
  Abhilash Majumder 6a78b96764 Merge branch 'main' into ipex_feature hai 1 ano
  Matthias Reso 4c225c65eb Fix order of concat vs sampler hai 1 ano
  Matthias Reso 5da84b2913 Fix usage of dataclass for train_config and fsdp_config hai 1 ano
  Matthias Reso 653a79e3dd Invalidate context in labels for samsum + grammar hai 1 ano
  Matthias Reso a647955fc8 Make packing/padding a training setting hai 1 ano
  Matthias Reso 2e4bd2a665 Resize vocab size to fix idx error hai 1 ano
  Matthias Reso ca41c1c697 Adjust tests to len based batch sampling hai 1 ano
  Shijie Wu 91e2573aa8 pass weight_decay into optimizer hai 1 ano
  Howard Liberty cc356b6017 Add FSDP CPU offloading option hai 1 ano
  abhilash1910 ad6b27d316 merge conflicts hai 1 ano