|  Jeff Tang | 32e9d97167
							
							Update demo_apps/llama-on-prem.md | hace 2 años | 
				
					
						|  Jeff Tang | 729b2a996d
							
							Update demo_apps/llama-on-prem.md | hace 2 años | 
				
					
						|  Jeff Tang | 1610108f5d
							
							Update demo_apps/llama-on-prem.md | hace 2 años | 
				
					
						|  Jeff Tang | f42fec84cd
							
							spelling check failures fix | hace 2 años | 
				
					
						|  Jeff Tang | f880e58c67
							
							simplify vllm install and api server run | hace 2 años | 
				
					
						|  Jeff Tang | c97d28c65c
							
							update based on PR feedback | hace 2 años | 
				
					
						|  Jeff Tang | 492350ae45
							
							vllm tgi comp | hace 2 años | 
				
					
						|  Jeff Tang | 95db9a0193
							
							multiple gpu vllm | hace 2 años | 
				
					
						|  Jeff Tang | dd84ee36ae
							
							llama-on-prem.md update on the HG access token | hace 2 años | 
				
					
						|  Jeff Tang | eba8310d06
							
							readme more update | hace 2 años | 
				
					
						|  Jeff Tang | 025cce14ce
							
							readme markdown typo fix | hace 2 años | 
				
					
						|  Jeff Tang | 4d59093762
							
							readme update | hace 2 años | 
				
					
						|  Jeff Tang | 0c1e7b4c34
							
							on-prem Llama 2 tutorial using vLLM and TGI with client notebook | hace 2 años |