Commit History

Автор SHA1 Съобщение Дата
  Matthias Reso 113ea18bf1 Replace LlamaTokenizer with AutoTokenizer преди 11 месеца
  Hamid Shojanazeri 11f51db28c adding the kbit prep in the code преди 11 месеца
  Hamid Shojanazeri f058ff6ccd update due to peft new release преди 11 месеца
  Hamid Shojanazeri ffdc93f00a Merge branch 'main' into wandb_logging преди 1 година
  Matthias Reso c5a382e509 Make tests run on cpu only machines преди 1 година
  Hamid Shojanazeri 43ea6bfa71 Merge branch 'main' into ssdp преди 1 година
  Hamid Shojanazeri d51d2cce9c adding sdpa for flash attn преди 1 година
  Hamid Shojanazeri 9a2434f408 update the fine-tuning script преди 1 година
  Hamid Shojanazeri 162be4c045 Revert "Flop counter, profiling and GC (#357)" преди 1 година
  Hamid Shojanazeri 71d137c722 Merge branch 'main' into flop_counter_gc преди 1 година
  Less Wright 3f2c33e4f8 Update finetuning.py - remove nightly check преди 1 година
  Hamid Shojanazeri b15ffeeaf4 clean up преди 1 година
  Hamid Shojanazeri 19089269d3 add gc преди 1 година
  kldarek 989b6ee812 wandb logging feedback преди 1 година
  Abhilash Majumder 4793f0fdf3 Merge branch 'main' into ipex_feature преди 1 година
  kldarek fc5485d916 fixing wandb for fsdp преди 1 година
  kldarek f2406cac07 cleanup spaces преди 1 година
  kldarek cf373529f7 basic wandb logging instrumentation преди 1 година
  Hamid Shojanazeri aa24e8f57e fix typos преди 1 година
  Hamid Shojanazeri 38c8cf08c4 adding hsdp преди 1 година
  Abhilash Majumder 6a78b96764 Merge branch 'main' into ipex_feature преди 1 година
  Matthias Reso 4c225c65eb Fix order of concat vs sampler преди 1 година
  Matthias Reso 5da84b2913 Fix usage of dataclass for train_config and fsdp_config преди 1 година
  Matthias Reso 653a79e3dd Invalidate context in labels for samsum + grammar преди 1 година
  Matthias Reso a647955fc8 Make packing/padding a training setting преди 1 година
  Matthias Reso 2e4bd2a665 Resize vocab size to fix idx error преди 1 година
  Matthias Reso ca41c1c697 Adjust tests to len based batch sampling преди 1 година
  Shijie Wu 91e2573aa8 pass weight_decay into optimizer преди 1 година
  Howard Liberty cc356b6017 Add FSDP CPU offloading option преди 1 година
  abhilash1910 ad6b27d316 merge conflicts преди 1 година