Matthias Reso
|
9def4fbafd
Remove micro_batch_training parameter and replace with gradient_accumulation_steps
|
1 năm trước cách đây |
Brian Vaughan
|
3faf005226
fix a bug in the config for use_fast_kernels
|
1 năm trước cách đây |
lchu
|
feaa344af3
resolve conflicts
|
1 năm trước cách đây |
Hamid Shojanazeri
|
44ef280d31
adding flash attention and xformer memory efficient through PT SDPA
|
1 năm trước cách đây |
lchu
|
895dfcea30
add nightly check for using low_cpu_fsdp mode
|
1 năm trước cách đây |
chauhang
|
4767f09ecd
Initial commit
|
1 năm trước cách đây |