Hamid Shojanazeri
|
d51d2cce9c
adding sdpa for flash attn
|
1 年間 前 |
Hamid Shojanazeri
|
9a2434f408
update the fine-tuning script
|
1 年間 前 |
Hamid Shojanazeri
|
162be4c045
Revert "Flop counter, profiling and GC (#357)"
|
1 年間 前 |
Hamid Shojanazeri
|
71d137c722
Merge branch 'main' into flop_counter_gc
|
1 年間 前 |
Less Wright
|
3f2c33e4f8
Update finetuning.py - remove nightly check
|
1 年間 前 |
Hamid Shojanazeri
|
b15ffeeaf4
clean up
|
1 年間 前 |
Hamid Shojanazeri
|
19089269d3
add gc
|
1 年間 前 |
Abhilash Majumder
|
4793f0fdf3
Merge branch 'main' into ipex_feature
|
1 年間 前 |
Abhilash Majumder
|
6a78b96764
Merge branch 'main' into ipex_feature
|
1 年間 前 |
Matthias Reso
|
4c225c65eb
Fix order of concat vs sampler
|
1 年間 前 |
Matthias Reso
|
5da84b2913
Fix usage of dataclass for train_config and fsdp_config
|
1 年間 前 |
Matthias Reso
|
653a79e3dd
Invalidate context in labels for samsum + grammar
|
1 年間 前 |
Matthias Reso
|
a647955fc8
Make packing/padding a training setting
|
1 年間 前 |
Matthias Reso
|
2e4bd2a665
Resize vocab size to fix idx error
|
1 年間 前 |
Matthias Reso
|
ca41c1c697
Adjust tests to len based batch sampling
|
1 年間 前 |
Shijie Wu
|
91e2573aa8
pass weight_decay into optimizer
|
1 年間 前 |
Howard Liberty
|
cc356b6017
Add FSDP CPU offloading option
|
1 年間 前 |
abhilash1910
|
ad6b27d316
merge conflicts
|
1 年間 前 |
abhilash1910
|
33da341af5
upstream resolve conflict
|
1 年間 前 |
Matthias Reso
|
eb69e754a0
Merge branch 'main' into feature/package_distribution
|
1 年間 前 |
Matthias Reso
|
72a9832571
Merge branch 'main' into feature/package_distribution
|
1 年間 前 |
Matthias Reso
|
ce9501f22c
remove relative imports
|
1 年間 前 |
Matthias Reso
|
5b58afc754
Fix div by zero if run_validation=False
|
1 年間 前 |
Matthias Reso
|
cf678b9bf0
Adjust imports to package structure + cleaned up imports
|
1 年間 前 |
Matthias Reso
|
4c9cc7d223
Move modules into separate src folder
|
1 年間 前 |