Jeff Tang 90dccf7990 update llama-on-prem.md to Llama 3 | 6 tháng trước cách đây | |
---|---|---|
.. | ||
hf_text_generation_inference | 8 tháng trước cách đây | |
vllm | 8 tháng trước cách đây | |
README.md | 8 tháng trước cách đây | |
llama-on-prem.md | 6 tháng trước cách đây |
This tutorial shows how to use Llama 2 with vLLM and Hugging Face TGI to build Llama 2 on-prem apps.
* To run a quantized Llama2 model on iOS and Android, you can use the open source MLC LLM or llama.cpp. You can even make a Linux OS that boots to Llama2 (repo).