Explorar o código

Fix the chat example for generate when load peft model (#158)

Geeta Chauhan hai 1 ano
pai
achega
322522e9a2
Modificáronse 1 ficheiros con 1 adicións e 1 borrados
  1. 1 1
      inference/chat_completion.py

+ 1 - 1
inference/chat_completion.py

@@ -107,7 +107,7 @@ def main(
             tokens= tokens.unsqueeze(0)
             tokens= tokens.to("cuda:0")
             outputs = model.generate(
-                tokens,
+                input_ids=tokens,
                 max_new_tokens=max_new_tokens,
                 do_sample=do_sample,
                 top_p=top_p,