浏览代码

minor code optimization

lchu 1 年之前
父节点
当前提交
3d1e9cd58c
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 1 1
      llama_finetuning.py

+ 1 - 1
llama_finetuning.py

@@ -137,7 +137,7 @@ def main(**kwargs):
             sharding_strategy=fsdp_config.sharding_strategy,
             device_id=torch.cuda.current_device(),
             limit_all_gathers=True,
-            sync_module_states=True if train_config.low_cpu_fsdp else False,
+            sync_module_states=train_config.low_cpu_fsdp,
             param_init_fn=lambda module: module.to_empty(device=torch.device("cuda"), recurse=False)
             if train_config.low_cpu_fsdp and rank != 0 else None,
         )