Hamid Shojanazeri 5cedef2155 Update llama-on-prem.md před 6 měsíci
..
hf_text_generation_inference 6d449a859b New folder structure (#1) před 8 měsíci
vllm 6d449a859b New folder structure (#1) před 8 měsíci
README.md 6d449a859b New folder structure (#1) před 8 měsíci
llama-on-prem.md 5cedef2155 Update llama-on-prem.md před 6 měsíci

README.md

Running Llama2 On-Prem with vLLM and TGI

This tutorial shows how to use Llama 2 with vLLM and Hugging Face TGI to build Llama 2 on-prem apps.

* To run a quantized Llama2 model on iOS and Android, you can use the open source MLC LLM or llama.cpp. You can even make a Linux OS that boots to Llama2 (repo).