1 year ago · 07bcffbf50
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -0,0 +1,18 @@
 
																+# Copyright (c) Meta Platforms, Inc. and affiliates.
															
 
																+# This software may be used and distributed according to the terms of the Llama 2 Community License Agreement.
															
 
																+
															
 
																+import pytest
															
 
																+
															
 
																+from transformers import LlamaTokenizer
															
 
																+
															
 
																+
															
 
																+@pytest.fixture
															
 
																+def setup_tokenizer():
															
 
																+    def _helper(tokenizer):
															
 
																+        #Align with Llama 2 tokenizer
															
 
																+        tokenizer.from_pretrained.return_value = LlamaTokenizer.from_pretrained("decapoda-research/llama-7b-hf")
															
 
																+        tokenizer.from_pretrained.return_value.add_special_tokens({'bos_token': '<s>', 'eos_token': '</s>'})
															
 
																+        tokenizer.from_pretrained.return_value.bos_token_id = 1
															
 
																+        tokenizer.from_pretrained.return_value.eos_token_id = 2
															
 
																+
															
 
																+    return _helper
															
--- a/tests/test_batching.py
+++ b/tests/test_batching.py
@@ -0,0 +1,94 @@
 
																+# Copyright (c) Meta Platforms, Inc. and affiliates.
															
 
																+# This software may be used and distributed according to the terms of the Llama 2 Community License Agreement.
															
 
																+
															
 
																+import pytest
															
 
																+from unittest.mock import patch
															
 
																+
															
 
																+
															
 
																+@patch('llama_recipes.finetuning.train')
															
 
																+@patch('llama_recipes.finetuning.LlamaTokenizer')
															
 
																+@patch('llama_recipes.finetuning.LlamaForCausalLM.from_pretrained')
															
 
																+@patch('llama_recipes.finetuning.optim.AdamW')
															
 
																+@patch('llama_recipes.finetuning.StepLR')
															
 
																+def test_packing(step_lr, optimizer, get_model, tokenizer, train, mocker, setup_tokenizer):
															
 
																+    from llama_recipes.finetuning import main
															
 
																+
															
 
																+    setup_tokenizer(tokenizer)
															
 
																+
															
 
																+    kwargs = {
															
 
																+        "model_name": "decapoda-research/llama-7b-hf",
															
 
																+        "batch_size_training": 8,
															
 
																+        "val_batch_size": 1,
															
 
																+        "use_peft": False,
															
 
																+        "dataset": "samsum_dataset",
															
 
																+        "batching_strategy": "packing",
															
 
																+        }
															
 
																+
															
 
																+    main(**kwargs)
															
 
																+
															
 
																+    assert train.call_count == 1
															
 
																+
															
 
																+    args, kwargs = train.call_args
															
 
																+    train_dataloader = args[1]
															
 
																+    eval_dataloader = args[2]
															
 
																+
															
 
																+    assert len(train_dataloader) == 96
															
 
																+    assert len(eval_dataloader) == 42
															
 
																+
															
 
																+    batch = next(iter(train_dataloader))
															
 
																+
															
 
																+    assert "labels" in batch.keys()
															
 
																+    assert "input_ids" in batch.keys()
															
 
																+    assert "attention_mask" in batch.keys()
															
 
																+
															
 
																+    assert batch["labels"][0].size(0) == 4096
															
 
																+    assert batch["input_ids"][0].size(0) == 4096
															
 
																+    assert batch["attention_mask"][0].size(0) == 4096
															
 
																+
															
 
																+
															
 
																+@patch('llama_recipes.finetuning.train')
															
 
																+@patch('llama_recipes.finetuning.LlamaTokenizer')
															
 
																+@patch('llama_recipes.finetuning.LlamaForCausalLM.from_pretrained')
															
 
																+@patch('llama_recipes.finetuning.optim.AdamW')
															
 
																+@patch('llama_recipes.finetuning.StepLR')
															
 
																+@patch('llama_recipes.finetuning.setup')
															
 
																+@patch('llama_recipes.finetuning.FSDP')
															
 
																+@patch('llama_recipes.finetuning.torch.distributed.is_initialized')
															
 
																+@patch('llama_recipes.utils.config_utils.dist')
															
 
																+def test_distributed_packing(dist, is_initialized, fsdp, setup, step_lr, optimizer, get_model, tokenizer, train, setup_tokenizer):
															
 
																+    import os
															
 
																+    from llama_recipes.finetuning import main
															
 
																+
															
 
																+    setup_tokenizer(tokenizer)
															
 
																+
															
 
																+    rank = 0
															
 
																+    os.environ['LOCAL_RANK'] = f'{rank}'
															
 
																+    os.environ['RANK'] = f'{rank}'
															
 
																+    os.environ['WORLD_SIZE'] = '2'
															
 
																+    os.environ['MASTER_ADDR'] = 'localhost'
															
 
																+    os.environ['MASTER_PORT'] = '12345'
															
 
																+
															
 
																+    kwargs = {
															
 
																+        "model_name": "decapoda-research/llama-7b-hf",
															
 
																+        "batch_size_training": 8,
															
 
																+        "val_batch_size": 1,
															
 
																+        "use_peft": False,
															
 
																+        "dataset": "samsum_dataset",
															
 
																+        "batching_strategy": "packing",
															
 
																+        "enable_fsdp": True
															
 
																+        }
															
 
																+
															
 
																+    is_initialized.return_value = True
															
 
																+    dist.get_rank.return_value = rank
															
 
																+    dist.get_world_size.return_value = 2
															
 
																+
															
 
																+    main(**kwargs)
															
 
																+
															
 
																+    assert train.call_count == 1
															
 
																+
															
 
																+    args, kwargs = train.call_args
															
 
																+    train_dataloader = args[1]
															
 
																+    eval_dataloader = args[2]
															
 
																+
															
 
																+    assert len(train_dataloader) == 96 //2
															
 
																+    assert len(eval_dataloader) == 42 //2