Chester Hu
|
5cea990a5c
original commit for PR
|
hai 1 ano |
Jeff Tang
|
54ff88e9a6
README update
|
hai 1 ano |
Jeff Tang
|
1acbb2ba13
Building Llama-enabled WhatsApp Chatbot
|
hai 1 ano |
Hamid Shojanazeri
|
3b77a270a8
Llama 2 On-Prem Inference Using vLLM and TGI (#279)
|
hai 1 ano |
Jeff Tang
|
32e9d97167
Update demo_apps/llama-on-prem.md
|
hai 1 ano |
Jeff Tang
|
729b2a996d
Update demo_apps/llama-on-prem.md
|
hai 1 ano |
Jeff Tang
|
0199c8454c
readme update
|
hai 1 ano |
Jeff Tang
|
1610108f5d
Update demo_apps/llama-on-prem.md
|
hai 1 ano |
Jeff Tang
|
f42fec84cd
spelling check failures fix
|
hai 1 ano |
Jeff Tang
|
f880e58c67
simplify vllm install and api server run
|
hai 1 ano |
Jeff Tang
|
ec72c6618c
update main README
|
hai 1 ano |
gaopengzhi
|
b1d9efd155
Refactor gradient clipping feature
|
hai 1 ano |
Jeff Tang
|
c97d28c65c
update based on PR feedback
|
hai 1 ano |
Beto
|
17d02c3b44
Adding config to conditionally save stats
|
hai 1 ano |
Beto
|
b974c87035
Merging latest from main
|
hai 1 ano |
Jeff Tang
|
492350ae45
vllm tgi comp
|
hai 1 ano |
Jeff Tang
|
95db9a0193
multiple gpu vllm
|
hai 1 ano |
Hamid Shojanazeri
|
acce2d8770
Use bf16 parameters in bf16 mixed prec (#283)
|
hai 1 ano |
Jeff Tang
|
dd84ee36ae
llama-on-prem.md update on the HG access token
|
hai 1 ano |
Jeff Tang
|
35686f4353
main readme update
|
hai 1 ano |
Jeremy Howard
|
eca8410b32
Use bf16 parameters in bf16 mixed prec
|
hai 1 ano |
gaopengzhi
|
04befdef69
Add gradient clipping feature
|
hai 1 ano |
Jeff Tang
|
da8f9f0d41
more update README
|
hai 1 ano |
Jeff Tang
|
106327acdd
more update README
|
hai 1 ano |
Jeff Tang
|
54cd436352
more update README
|
hai 1 ano |
Jeff Tang
|
eba8310d06
readme more update
|
hai 1 ano |
Jeff Tang
|
025cce14ce
readme markdown typo fix
|
hai 1 ano |
Jeff Tang
|
4d59093762
readme update
|
hai 1 ano |
Jeff Tang
|
ad9c2c6444
update README
|
hai 1 ano |
Jeff Tang
|
add9623940
update README to refer to llama on prem
|
hai 1 ano |