Matthias Reso
|
4c225c65eb
Fix order of concat vs sampler
|
1 yıl önce |
Matthias Reso
|
5da84b2913
Fix usage of dataclass for train_config and fsdp_config
|
1 yıl önce |
Matthias Reso
|
653a79e3dd
Invalidate context in labels for samsum + grammar
|
1 yıl önce |
Matthias Reso
|
a647955fc8
Make packing/padding a training setting
|
1 yıl önce |
Matthias Reso
|
2e4bd2a665
Resize vocab size to fix idx error
|
1 yıl önce |
Matthias Reso
|
ca41c1c697
Adjust tests to len based batch sampling
|
1 yıl önce |
Shijie Wu
|
91e2573aa8
pass weight_decay into optimizer
|
1 yıl önce |
Howard Liberty
|
cc356b6017
Add FSDP CPU offloading option
|
1 yıl önce |
Matthias Reso
|
eb69e754a0
Merge branch 'main' into feature/package_distribution
|
1 yıl önce |
Matthias Reso
|
72a9832571
Merge branch 'main' into feature/package_distribution
|
1 yıl önce |
Matthias Reso
|
ce9501f22c
remove relative imports
|
1 yıl önce |
Matthias Reso
|
5b58afc754
Fix div by zero if run_validation=False
|
1 yıl önce |
Matthias Reso
|
cf678b9bf0
Adjust imports to package structure + cleaned up imports
|
1 yıl önce |
Matthias Reso
|
4c9cc7d223
Move modules into separate src folder
|
1 yıl önce |