|  Matthias Reso | e2f77dbc21
							
							fix quant config | před 1 rokem | 
				
					
						|  Matthias Reso | 6ef9a78458
							
							Fix issues with quantization_config == None | před 1 rokem | 
				
					
						|  Matthias Reso | b319a9fb8c
							
							Fix lint issue | před 1 rokem | 
				
					
						|  Matthias Reso | a3fd369127
							
							Ref from infernce recipes to vllm for 405B | před 1 rokem | 
				
					
						|  Matthias Reso | a8f2267324
							
							Added multi node doc to multigpu_finetuning.md | před 1 rokem | 
				
					
						|  Matthias Reso | afb3b75892
							
							Add 405B + QLoRA + FSDP to multi_gpu.md doc | před 1 rokem | 
				
					
						|  Matthias Reso | 939c88fb04
							
							Add 405B + QLoRA ref to LLM finetung | před 1 rokem | 
				
					
						|  Matthias Reso | d2fd9c163a
							
							Added doc for multi-node vllm inference | před 1 rokem | 
				
					
						|  Thomas Robinson | 1a183c0a5e
							
							Introduce Llama guard customization notebook and associated dataset loader example | před 1 rokem | 
				
					
						|  Cyrus Nikolaidis | 301e51a340
							
							Merge branch 'main' of github.com:meta-llama/llama-recipes-alpha | před 1 rokem | 
				
					
						|  Cyrus Nikolaidis | 883def17f0
							
							Prompt Guard Inference for long strings | před 1 rokem | 
				
					
						|  Suraj Subramanian | 0d00616b34
							
							Move MediaGen notebook to octoai folder (#601) | před 1 rokem | 
				
					
						|  Suraj Subramanian | 5a9858f0f0
							
							Update README.md to remove mediagen reference | před 1 rokem | 
				
					
						|  Suraj Subramanian | 5a878654ec
							
							Move MediaGen notebook to octoai folder | před 1 rokem | 
				
					
						|  Suraj | 4be3eb0d17
							
							Updates HF model_ids and readmes for 3.1 | před 1 rokem | 
				
					
						|  Matthias Reso | c9ae014459
							
							Enable pipeline parallelism through use of AsyncLLMEngine in vllm inferecen + enable use of lora adapter | před 1 rokem | 
				
					
						|  Suraj | d1d08f9b82
							
							Update promptguard model-id | před 1 rokem | 
				
					
						|  Suraj | 308026aad5
							
							Adds tentative llamaguard HF model id, eos_token_id for model.generate | před 1 rokem | 
				
					
						|  Matthias Reso | 0920b1a415
							
							Fix quantization for inference | před 1 rokem | 
				
					
						|  Matthias Reso | b36830fdf6
							
							Fix reading in stdin for chat_completion, remove padding as we're feeding single samples | před 1 rokem | 
				
					
						|  Matthias Reso | f0aa8e31ca
							
							Update url | před 1 rokem | 
				
					
						|  Matthias Reso | 9db61e5235
							
							Refactored infeence to allow multiple requests through gradio | před 1 rokem | 
				
					
						|  Thomas Robinson | fd9f52f710
							
							Modify prompt_format_utils with changes necessary for Llama Guard 3 (#1) | před 1 rokem | 
				
					
						|  Cyrus Nikolaidis | 0c57646481
							
							Prompt Guard Tutorial | před 1 rokem | 
				
					
						|  Suraj Subramanian | d3d2cadc4d
							
							Update links in README.md (#589) | před 1 rokem | 
				
					
						|  Suraj Subramanian | 7dcc7307d8
							
							Fix relative links to images (#596) | před 1 rokem | 
				
					
						|  Suraj Subramanian | a4b6a55aaf
							
							Fix broken image link (#597) | před 1 rokem | 
				
					
						|  Suraj Subramanian | 5b3aaa038c
							
							Fix broken image link | před 1 rokem | 
				
					
						|  Suraj Subramanian | 78b4a7fcff
							
							Fix relative links to images | před 1 rokem | 
				
					
						|  Hamid Shojanazeri | 808a3f7a0c
							
							Adding support for FSDP+Qlora. (#572) | před 1 rokem |