gaopengzhi
|
c7d410725b
Merge branch 'main' into grad_clip
|
před 1 rokem |
gaopengzhi
|
e2797abe9b
Add gradient_clipping and gradient_clipping_threshold parameters
|
před 1 rokem |
gaopengzhi
|
bb7c6c1e33
Support FSDP scenario
|
před 1 rokem |
gaopengzhi
|
b1d9efd155
Refactor gradient clipping feature
|
před 1 rokem |
Jeremy Howard
|
eca8410b32
Use bf16 parameters in bf16 mixed prec
|
před 1 rokem |
gaopengzhi
|
04befdef69
Add gradient clipping feature
|
před 1 rokem |
Matthias Reso
|
e8bb7fbabc
Merge remote-tracking branch 'origin/main' into feature/length_based_batch_sampling
|
před 1 rokem |
Matthias Reso
|
33925f71e6
Add missing amp context if use_fp16 is enabled
|
před 1 rokem |
Matthias Reso
|
10f9367e56
fix missing labels in datasets
|
před 1 rokem |
hongbo.mo
|
6217635e87
Fix tqdm bar not change length after terminal is resized
|
před 1 rokem |
Matthias Reso
|
c33ea3cacb
Fix pbar update
|
před 1 rokem |
hongbo.mo
|
5e910e6a42
Fix typo
|
před 1 rokem |
hongbo.mo
|
0bc6a07a80
bugfix: update tqdm bar with the fixed gradient_accumulation_steps
|
před 1 rokem |
Matthias Reso
|
72a9832571
Merge branch 'main' into feature/package_distribution
|
před 1 rokem |
Matthias Reso
|
ce9501f22c
remove relative imports
|
před 1 rokem |
Matthias Reso
|
5b58afc754
Fix div by zero if run_validation=False
|
před 1 rokem |
Matthias Reso
|
cf678b9bf0
Adjust imports to package structure + cleaned up imports
|
před 1 rokem |
Matthias Reso
|
4c9cc7d223
Move modules into separate src folder
|
před 1 rokem |