1 gadu atpakaļ · 17a6d16289
--- a/src/llama_recipes/utils/config_utils.py
+++ b/src/llama_recipes/utils/config_utils.py
@@ -90,6 +90,7 @@ def get_dataloader_kwargs(train_config, dataset, tokenizer, mode):
 
				                 rank=dist.get_rank(),
			
 
				                 num_replicas=dist.get_world_size(),
			
 
				                 shuffle=mode=="train",
			
 
				+                drop_last=True,
			
 
				             )
			
 
				             kwargs["batch_size"] = batch_size
			
 
				             kwargs["drop_last"] = True
			
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -3,21 +3,26 @@
 
				 
			
 
				 import pytest
			
 
				 
			
 
				-from transformers import LlamaTokenizer
			
 
				+from transformers import AutoTokenizer
			
 
				 
			
 
				 ACCESS_ERROR_MSG = "Could not access tokenizer at 'meta-llama/Llama-2-7b-hf'. Did you log into huggingface hub and provided the correct token?"
			
 
				+LLAMA_VERSIONS = ["meta-llama/Llama-2-7b-hf", "hsramall/hsramall-7b-hf"]
			
 
				+
			
 
				+@pytest.fixture(params=LLAMA_VERSIONS)
			
 
				+def llama_version(request):
			
 
				+    return request.param
			
 
				 
			
 
				 
			
 
				 @pytest.fixture(scope="module")
			
 
				-def llama_tokenizer():
			
 
				-    return LlamaTokenizer.from_pretrained("meta-llama/Llama-2-7b-hf")
			
 
				+def llama_tokenizer(request):
			
 
				+    return {k: AutoTokenizer.from_pretrained(k) for k in LLAMA_VERSIONS}
			
 
				 
			
 
				 
			
 
				 @pytest.fixture
			
 
				-def setup_tokenizer(llama_tokenizer):
			
 
				+def setup_tokenizer(llama_tokenizer, llama_version):
			
 
				     def _helper(tokenizer_mock):
			
 
				         #Align with Llama 2 tokenizer
			
 
				-        tokenizer_mock.from_pretrained.return_value = llama_tokenizer
			
 
				+        tokenizer_mock.from_pretrained.return_value = llama_tokenizer[llama_version]
			
 
				 
			
 
				     return _helper
			
 
				 
			
@@ -27,21 +32,21 @@ def pytest_addoption(parser):
 
				         "--unskip-missing-tokenizer",
			
 
				         action="store_true",
			
 
				         default=False, help="disable skip missing tokenizer")
			
 
				-    
			
 
				+
			
 
				 def pytest_configure(config):
			
 
				     config.addinivalue_line("markers", "skip_missing_tokenizer: skip if tokenizer is unavailable")
			
 
				 
			
 
				-    
			
 
				+
			
 
				 def pytest_collection_modifyitems(config, items):
			
 
				     if config.getoption("--unskip-missing-tokenizer"):
			
 
				         return
			
 
				-    
			
 
				+
			
 
				     try:
			
 
				-        LlamaTokenizer.from_pretrained("meta-llama/Llama-2-7b-hf")
			
 
				+        AutoTokenizer.from_pretrained("meta-llama/Llama-2-7b-hf")
			
 
				         tokenizer_available = True
			
 
				     except OSError:
			
 
				         tokenizer_available = False
			
 
				-    
			
 
				+
			
 
				     skip_missing_tokenizer = pytest.mark.skip(reason=ACCESS_ERROR_MSG)
			
 
				     for item in items:
			
 
				         if "skip_missing_tokenizer" in item.keywords and not tokenizer_available:
			
--- a/tests/test_batching.py
+++ b/tests/test_batching.py
@@ -4,20 +4,30 @@
 
				 import pytest
			
 
				 from unittest.mock import patch
			
 
				 
			
 
				+EXPECTED_SAMPLE_NUMBER ={
			
 
				+    "meta-llama/Llama-2-7b-hf": {
			
 
				+        "train": 96,
			
 
				+        "eval": 42,
			
 
				+    },
			
 
				+    "hsramall/hsramall-7b-hf": {
			
 
				+        "train": 79,
			
 
				+        "eval": 34,
			
 
				+    }
			
 
				+}
			
 
				 
			
 
				 @pytest.mark.skip_missing_tokenizer
			
 
				 @patch('llama_recipes.finetuning.train')
			
 
				-@patch('llama_recipes.finetuning.LlamaTokenizer')
			
 
				+@patch('llama_recipes.finetuning.AutoTokenizer')
			
 
				 @patch('llama_recipes.finetuning.LlamaForCausalLM.from_pretrained')
			
 
				 @patch('llama_recipes.finetuning.optim.AdamW')
			
 
				 @patch('llama_recipes.finetuning.StepLR')
			
 
				-def test_packing(step_lr, optimizer, get_model, tokenizer, train, mocker, setup_tokenizer):
			
 
				+def test_packing(step_lr, optimizer, get_model, tokenizer, train, setup_tokenizer, llama_version):
			
 
				     from llama_recipes.finetuning import main
			
 
				 
			
 
				     setup_tokenizer(tokenizer)
			
 
				 
			
 
				     kwargs = {
			
 
				-        "model_name": "meta-llama/Llama-2-7b-hf",
			
 
				+        "model_name": llama_version,
			
 
				         "batch_size_training": 8,
			
 
				         "val_batch_size": 1,
			
 
				         "use_peft": False,
			
@@ -33,8 +43,8 @@ def test_packing(step_lr, optimizer, get_model, tokenizer, train, mocker, setup_
 
				     train_dataloader = args[1]
			
 
				     eval_dataloader = args[2]
			
 
				 
			
 
				-    assert len(train_dataloader) == 96
			
 
				-    assert len(eval_dataloader) == 42
			
 
				+    assert len(train_dataloader) == EXPECTED_SAMPLE_NUMBER[llama_version]["train"]
			
 
				+    assert len(eval_dataloader) == EXPECTED_SAMPLE_NUMBER[llama_version]["eval"]
			
 
				 
			
 
				     batch = next(iter(train_dataloader))
			
 
				 
			
@@ -49,7 +59,7 @@ def test_packing(step_lr, optimizer, get_model, tokenizer, train, mocker, setup_
 
				 
			
 
				 @pytest.mark.skip_missing_tokenizer
			
 
				 @patch('llama_recipes.finetuning.train')
			
 
				-@patch('llama_recipes.finetuning.LlamaTokenizer')
			
 
				+@patch('llama_recipes.finetuning.AutoTokenizer')
			
 
				 @patch('llama_recipes.finetuning.LlamaForCausalLM.from_pretrained')
			
 
				 @patch('llama_recipes.finetuning.optim.AdamW')
			
 
				 @patch('llama_recipes.finetuning.StepLR')
			
@@ -57,13 +67,13 @@ def test_packing(step_lr, optimizer, get_model, tokenizer, train, mocker, setup_
 
				 @patch('llama_recipes.finetuning.FSDP')
			
 
				 @patch('llama_recipes.finetuning.torch.distributed.is_initialized')
			
 
				 @patch('llama_recipes.utils.config_utils.dist')
			
 
				-def test_distributed_packing(dist, is_initialized, fsdp, setup, step_lr, optimizer, get_model, tokenizer, train, setup_tokenizer):
			
 
				+def test_distributed_packing(dist, is_initialized, fsdp, setup, step_lr, optimizer, get_model, tokenizer, train, setup_tokenizer, llama_version):
			
 
				     import os
			
 
				     from llama_recipes.finetuning import main
			
 
				 
			
 
				     setup_tokenizer(tokenizer)
			
 
				 
			
 
				-    rank = 0
			
 
				+    rank = 1
			
 
				     os.environ['LOCAL_RANK'] = f'{rank}'
			
 
				     os.environ['RANK'] = f'{rank}'
			
 
				     os.environ['WORLD_SIZE'] = '2'
			
@@ -71,7 +81,7 @@ def test_distributed_packing(dist, is_initialized, fsdp, setup, step_lr, optimiz
 
				     os.environ['MASTER_PORT'] = '12345'
			
 
				 
			
 
				     kwargs = {
			
 
				-        "model_name": "meta-llama/Llama-2-7b-hf",
			
 
				+        "model_name": llama_version,
			
 
				         "batch_size_training": 8,
			
 
				         "val_batch_size": 1,
			
 
				         "use_peft": False,
			
@@ -92,5 +102,5 @@ def test_distributed_packing(dist, is_initialized, fsdp, setup, step_lr, optimiz
 
				     train_dataloader = args[1]
			
 
				     eval_dataloader = args[2]
			
 
				 
			
 
				-    assert len(train_dataloader) == 96 //2
			
 
				-    assert len(eval_dataloader) == 42 //2
			
 
				+    assert len(train_dataloader) == EXPECTED_SAMPLE_NUMBER[llama_version]["train"] //2
			
 
				+    assert len(eval_dataloader) == EXPECTED_SAMPLE_NUMBER[llama_version]["eval"] //2