Historie revizí

Autor SHA1 Zpráva Datum
  Hamid Shojanazeri 44ef280d31 adding flash attention and xformer memory efficient through PT SDPA před 1 rokem
  Philipp Parzer e6329a1fac Fix filename typo před 1 rokem
  luoyifan 79d0d4fc4e fix some typos. před 1 rokem
  lchu c453b668fa add doc example about using low_cpu_fsdp před 1 rokem
  Geeta Chauhan dd57dc5cf9 Update spellcheck.sh (#88) před 1 rokem
  lchu 80a4c36707 further fix #90 před 1 rokem
  lchu 0c51b47262 fix #90 před 1 rokem
  lchu c19c5c69aa fix fsdp construction on low_cpu_fsdp před 1 rokem
  lchu e216c6f1f3 address #87 před 1 rokem
  sekyonda 59b59afe88 Update spellcheck.sh před 1 rokem
  lchu 895dfcea30 add nightly check for using low_cpu_fsdp mode před 1 rokem
  Hamid Shojanazeri 9b0eae4056 add max_pad length as an arg před 1 rokem
  Hamid Shojanazeri 6beadcd8dd adding padding to inference script with embedding size changing před 1 rokem
  lchu 1e64fc98d9 switch to simpler param_init_fn and meta device init před 1 rokem
  lchu 101391f46a Revert "replace init_empty_weights with torch.device(meta)" před 1 rokem
  lchu c8d4f38d23 replace init_empty_weights with torch.device(meta) před 1 rokem
  lchu d8a81bb531 save cpu mem by leveraging FSDP rank0 broadcasting před 1 rokem
  Geeta Chauhan 1387b76e11 fixing the full state path in checkpoint handler+loss report calculation (#51) před 1 rokem
  Hamid Shojanazeri 88d3e1febc fix the save_train_param condition před 1 rokem
  Hamid Shojanazeri b56028c98d fixing the word list/spell check před 1 rokem
  Hamid Shojanazeri 62be60355a resolving conflicts před 1 rokem
  Geeta Chauhan 174b856591 update README: python 3.9 rec + fix formatting (#63) před 1 rokem
  Geeta Chauhan 0cd5694a14 Fsdp inference checkpoints (#39) před 1 rokem
  Hamid Shojanazeri c4e96af6ee clean up před 1 rokem
  Christian Miller 7c1884c690 recommend python 3.9 před 1 rokem
  Hamid Shojanazeri 7d2e06821e fixing the path to script před 1 rokem
  Hamid Shojanazeri 5f97db8f0c fix spell check word list před 1 rokem
  Hamid Shojanazeri 017cadd04b Merge branch 'checkpoint_handler_path_fix' of https://github.com/facebookresearch/llama-recipes into checkpoint_handler_path_fix před 1 rokem
  Hamid Shojanazeri 4f70348b94 remove the redundant lr step před 1 rokem
  Hamid Shojanazeri 9c95ed4bbe clean up před 1 rokem