Commit History

Автор SHA1 Съобщение Дата
  Geeta Chauhan 1387b76e11 fixing the full state path in checkpoint handler+loss report calculation (#51) преди 1 година
  Hamid Shojanazeri 88d3e1febc fix the save_train_param condition преди 1 година
  Hamid Shojanazeri b56028c98d fixing the word list/spell check преди 1 година
  Hamid Shojanazeri 62be60355a resolving conflicts преди 1 година
  Geeta Chauhan 174b856591 update README: python 3.9 rec + fix formatting (#63) преди 1 година
  Geeta Chauhan 0cd5694a14 Fsdp inference checkpoints (#39) преди 1 година
  Hamid Shojanazeri c4e96af6ee clean up преди 1 година
  Christian Miller 7c1884c690 recommend python 3.9 преди 1 година
  Hamid Shojanazeri 7d2e06821e fixing the path to script преди 1 година
  Hamid Shojanazeri 5f97db8f0c fix spell check word list преди 1 година
  Hamid Shojanazeri 017cadd04b Merge branch 'checkpoint_handler_path_fix' of https://github.com/facebookresearch/llama-recipes into checkpoint_handler_path_fix преди 1 година
  Hamid Shojanazeri 4f70348b94 remove the redundant lr step преди 1 година
  Hamid Shojanazeri 9c95ed4bbe clean up преди 1 година
  Hamid Shojanazeri 311a5c1eec add notes for train_param.yaml преди 1 година
  Hamid Shojanazeri 5b916114eb merge main branch преди 1 година
  Hamid Shojanazeri 668c364f6b add rank to save_train_params преди 1 година
  Hamid Shojanazeri 231c9e7da9 adding train_param.yaml saving for fsdp checkpoint loading for inference преди 1 година
  Hamid Shojanazeri 475e67b4ec clean up преди 1 година
  Hamid Shojanazeri 50e9d17045 add the default option for find the HF model_name/path from train_param.yaml преди 1 година
  Hamid Shojanazeri 41dd7ff1cb Merge branch 'main' into checkpoint_handler_path_fix преди 1 година
  Hamid Shojanazeri 31d6ce8bf6 adding expnadable sgement and dist debug flag info преди 1 година
  Hamid Shojanazeri a955ed1999 added checks for dist barrier and commented cuda exapnadable segements and dist_dbug преди 1 година
  Hamid Shojanazeri a2403c7c1a clean up преди 1 година
  Hamid Shojanazeri e9559d2669 fixing the train/eval_loss calcualtion преди 1 година
  Geeta Chauhan 2243b962fa Create spellcheck.yml (#50) преди 1 година
  Geeta Chauhan 3cc2b3787f Fix broken links in Dataset.md (#49) преди 1 година
  Geeta Chauhan 021ed8e312 adding active mem stat (#44) преди 1 година
  Geeta Chauhan 09db361d23 Templates updates (#67) преди 1 година
  Hamid Shojanazeri 4ba4400a75 adding dist barrier before and after checkpointing преди 1 година
  chauhang 95d59afcb8 Update PR template преди 1 година