Chester Hu
							
						 | 
						
							
							
								2c69317342
							
							Update README.md
						 | 
						hace 1 año | 
					
				
					
						
							
								   Chester Hu
							
						 | 
						
							
							
								fd849371e0
							
							Update readme
						 | 
						hace 1 año | 
					
				
					
						
							
								   Chester Hu
							
						 | 
						
							
							
								ff2ed1b2c8
							
							Update RAG_Chatbot_Example.ipynb
						 | 
						hace 1 año | 
					
				
					
						
							
								   Chester Hu
							
						 | 
						
							
							
								017a5c762b
							
							Update RAG_Chatbot_Example.ipynb
						 | 
						hace 2 años | 
					
				
					
						
							
								   Chester Hu
							
						 | 
						
							
							
								092c88f17b
							
							Remove personal file path
						 | 
						hace 2 años | 
					
				
					
						
							
								   Chester Hu
							
						 | 
						
							
							
								5cea990a5c
							
							original commit for PR
						 | 
						hace 2 años | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								3b77a270a8
							
							Llama 2 On-Prem Inference Using vLLM and TGI (#279)
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								32e9d97167
							
							Update demo_apps/llama-on-prem.md
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								729b2a996d
							
							Update demo_apps/llama-on-prem.md
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								0199c8454c
							
							readme update
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								1610108f5d
							
							Update demo_apps/llama-on-prem.md
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								f42fec84cd
							
							spelling check failures fix
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								f880e58c67
							
							simplify vllm install and api server run
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								ec72c6618c
							
							update main README
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								c97d28c65c
							
							update based on PR feedback
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								492350ae45
							
							vllm tgi comp
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								95db9a0193
							
							multiple gpu vllm
						 | 
						hace 2 años | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								acce2d8770
							
							Use bf16 parameters in bf16 mixed prec (#283)
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								dd84ee36ae
							
							llama-on-prem.md update on the HG access token
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								35686f4353
							
							main readme update
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeremy Howard
							
						 | 
						
							
							
								eca8410b32
							
							Use bf16 parameters in bf16 mixed prec
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								da8f9f0d41
							
							more update README
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								106327acdd
							
							more update README
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								54cd436352
							
							more update README
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								eba8310d06
							
							readme more update
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								025cce14ce
							
							readme markdown typo fix
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								4d59093762
							
							readme update
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								ad9c2c6444
							
							update README
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								add9623940
							
							update README to refer to llama on prem
						 | 
						hace 2 años | 
					
				
					
						
							
								   Jeff Tang
							
						 | 
						
							
							
								0c1e7b4c34
							
							on-prem Llama 2 tutorial using vLLM and TGI with client notebook
						 | 
						hace 2 años |