|  Beto | fe40d7f60e
							
							Adding the new llama inference code into the relevant readmes | hace 1 año | 
				
					
						|  Beto | 3e710f71f8
							
							renaming the prompt format file to conform to repo standards | hace 1 año | 
				
					
						|  Beto | 5f83e6d30b
							
							Formatting and updating Readme files, removing test methods and unnecesary prints. | hace 1 año | 
				
					
						|  Chester Hu | a31afa5cc7
							
							Fix more spellcheck and add to wordlist for ignore | hace 1 año | 
				
					
						|  Chester Hu | 3436e7cefb
							
							Fix spelling | hace 1 año | 
				
					
						|  Chester Hu | 72916646d5
							
							PR for inference throughput benchmark on-perm vllm | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 9ba2e028b1
							
							Merge branch 'main' into ssdp | hace 1 año | 
				
					
						|  Jeff Tang | 79bd012437
							
							Messenger Llama2 Chatbot Tutorial (#311) | hace 1 año | 
				
					
						|  Jeff Tang | 8d3800ac03
							
							README update | hace 1 año | 
				
					
						|  exhyy | 69db75d425
							
							fix incorrect split of InstructionDataset | hace 2 años | 
				
					
						|  Beto | c0886a0a89
							
							Fixing typo in self | hace 1 año | 
				
					
						|  Beto | f22a2442d7
							
							Removing example from file name | hace 1 año | 
				
					
						|  Beto | 0ab6c9ff46
							
							Adding example using the prompt_template and HF inference classes. Adding INTS tags to the prompt template | hace 1 año | 
				
					
						|  Michael Tontchev | f30007c128
							
							PR comment changes | hace 1 año | 
				
					
						|  Matthias Reso | e7b8afd671
							
							Fix test_finetuning for env without cuda | hace 1 año | 
				
					
						|  Dong Wang | cf0c589dc6
							
							add doc string | hace 1 año | 
				
					
						|  Dong Wang | 35acf4934e
							
							update fore comments: use module | hace 1 año | 
				
					
						|  Dong Wang | 4ff821109a
							
							typo again | hace 1 año | 
				
					
						|  Dong Wang | d915814ed9
							
							fix typo | hace 1 año | 
				
					
						|  Dong Wang | e755ed1d8f
							
							Add example conversion script to convert hf to consolidated weight format | hace 1 año | 
				
					
						|  Michael Tontchev | fc19074085
							
							comment fixes, type fixes | hace 1 año | 
				
					
						|  Michael Tontchev | fa2a314820
							
							Create finetuning data formatter plus tests | hace 1 año | 
				
					
						|  Beto | d92226a873
							
							Removing option for local model, it's not working as expected. Would need further testing with the models from HF | hace 1 año | 
				
					
						|  Beto | 7881b3bb99
							
							Changing safety utils to use HF classes to load Llama Guard. Removing Llama plain inference code | hace 1 año | 
				
					
						|  Chester Hu | 348d47fe6a
							
							Update PR number | hace 1 año | 
				
					
						|  Chester Hu | 6cd89b7d38
							
							PR to add Azure API examples | hace 1 año | 
				
					
						|  Jeff Tang | 78f94b7712
							
							messenger llama tutorial update with Gunicorn link | hace 1 año | 
				
					
						|  Jeff Tang | 3ec886993d
							
							messenger llama tutorial update | hace 1 año | 
				
					
						|  Jeff Tang | 3006014581
							
							llama_messenger.py update | hace 1 año | 
				
					
						|  Jeff Tang | 826776bca0
							
							Merge branch 'main' into messenger | hace 1 año |