|  Abhilash Majumder | 4793f0fdf3
							
							Merge branch 'main' into ipex_feature | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 38df368a70
							
							A tutorial of building a Llama-enabled WhatsApp Chatbot (#287) | hace 1 año | 
				
					
						|  Jeff Tang | e722c12581
							
							spell check errors fix | hace 1 año | 
				
					
						|  Jeff Tang | 7298487dbc
							
							updated tutorial and added llama_chatbot.py | hace 1 año | 
				
					
						|  Jeff Tang | 49beaefbb1
							
							whatsapp_llama2 update based on Beto feedback | hace 2 años | 
				
					
						|  Jeff Tang | 54ff88e9a6
							
							README update | hace 2 años | 
				
					
						|  Jeff Tang | 1acbb2ba13
							
							Building Llama-enabled WhatsApp Chatbot | hace 2 años | 
				
					
						|  Hamid Shojanazeri | 3b77a270a8
							
							Llama 2 On-Prem Inference Using vLLM and TGI (#279) | hace 2 años | 
				
					
						|  Jeff Tang | 32e9d97167
							
							Update demo_apps/llama-on-prem.md | hace 2 años | 
				
					
						|  Jeff Tang | 729b2a996d
							
							Update demo_apps/llama-on-prem.md | hace 2 años | 
				
					
						|  Jeff Tang | 0199c8454c
							
							readme update | hace 2 años | 
				
					
						|  Jeff Tang | 1610108f5d
							
							Update demo_apps/llama-on-prem.md | hace 2 años | 
				
					
						|  Jeff Tang | f42fec84cd
							
							spelling check failures fix | hace 2 años | 
				
					
						|  Jeff Tang | f880e58c67
							
							simplify vllm install and api server run | hace 2 años | 
				
					
						|  Jeff Tang | ec72c6618c
							
							update main README | hace 2 años | 
				
					
						|  Jeff Tang | c97d28c65c
							
							update based on PR feedback | hace 2 años | 
				
					
						|  Jeff Tang | 492350ae45
							
							vllm tgi comp | hace 2 años | 
				
					
						|  Jeff Tang | 95db9a0193
							
							multiple gpu vllm | hace 2 años | 
				
					
						|  Hamid Shojanazeri | acce2d8770
							
							Use bf16 parameters in bf16 mixed prec (#283) | hace 2 años | 
				
					
						|  Jeff Tang | dd84ee36ae
							
							llama-on-prem.md update on the HG access token | hace 2 años | 
				
					
						|  Jeff Tang | 35686f4353
							
							main readme update | hace 2 años | 
				
					
						|  Jeremy Howard | eca8410b32
							
							Use bf16 parameters in bf16 mixed prec | hace 2 años | 
				
					
						|  Jeff Tang | da8f9f0d41
							
							more update README | hace 2 años | 
				
					
						|  Jeff Tang | 106327acdd
							
							more update README | hace 2 años | 
				
					
						|  Jeff Tang | 54cd436352
							
							more update README | hace 2 años | 
				
					
						|  Jeff Tang | eba8310d06
							
							readme more update | hace 2 años | 
				
					
						|  Jeff Tang | 025cce14ce
							
							readme markdown typo fix | hace 2 años | 
				
					
						|  Jeff Tang | 4d59093762
							
							readme update | hace 2 años | 
				
					
						|  Jeff Tang | ad9c2c6444
							
							update README | hace 2 años | 
				
					
						|  Jeff Tang | add9623940
							
							update README to refer to llama on prem | hace 2 años |