Historie revizí

Autor SHA1 Zpráva Datum
  Matthias Reso c167945448 remove 405B ft doc před 1 rokem
  Matthias Reso b0b4e16aec Update docs/multi_gpu.md před 1 rokem
  Suraj a81524c27c spellcheck appeasement před 1 rokem
  Suraj 7296833d43 Add codeshield to requirements před 1 rokem
  Suraj 7cac948093 Update special tokens table and URL před 1 rokem
  Suraj 88167d59ca Merge branch 'main' of https://github.com/meta-llama/llama-recipes-alpha into main před 1 rokem
  Suraj a9e8f810e7 Merge branch 'main' of https://github.com/meta-llama/llama-recipes-alpha into hf_model_id před 1 rokem
  Matthias Reso e2f77dbc21 fix quant config před 1 rokem
  Matthias Reso 6ef9a78458 Fix issues with quantization_config == None před 1 rokem
  Matthias Reso b319a9fb8c Fix lint issue před 1 rokem
  Matthias Reso a3fd369127 Ref from infernce recipes to vllm for 405B před 1 rokem
  Matthias Reso a8f2267324 Added multi node doc to multigpu_finetuning.md před 1 rokem
  Matthias Reso afb3b75892 Add 405B + QLoRA + FSDP to multi_gpu.md doc před 1 rokem
  Matthias Reso 939c88fb04 Add 405B + QLoRA ref to LLM finetung před 1 rokem
  Matthias Reso d2fd9c163a Added doc for multi-node vllm inference před 1 rokem
  Thomas Robinson 1a183c0a5e Introduce Llama guard customization notebook and associated dataset loader example před 1 rokem
  Cyrus Nikolaidis 301e51a340 Merge branch 'main' of github.com:meta-llama/llama-recipes-alpha před 1 rokem
  Cyrus Nikolaidis 883def17f0 Prompt Guard Inference for long strings před 1 rokem
  Suraj Subramanian 0d00616b34 Move MediaGen notebook to octoai folder (#601) před 1 rokem
  Suraj Subramanian 5a9858f0f0 Update README.md to remove mediagen reference před 1 rokem
  Suraj Subramanian 5a878654ec Move MediaGen notebook to octoai folder před 1 rokem
  Suraj 4be3eb0d17 Updates HF model_ids and readmes for 3.1 před 1 rokem
  Matthias Reso c9ae014459 Enable pipeline parallelism through use of AsyncLLMEngine in vllm inferecen + enable use of lora adapter před 1 rokem
  Suraj d1d08f9b82 Update promptguard model-id před 1 rokem
  Suraj 308026aad5 Adds tentative llamaguard HF model id, eos_token_id for model.generate před 1 rokem
  Matthias Reso 0920b1a415 Fix quantization for inference před 1 rokem
  Matthias Reso b36830fdf6 Fix reading in stdin for chat_completion, remove padding as we're feeding single samples před 1 rokem
  Matthias Reso f0aa8e31ca Update url před 1 rokem
  Matthias Reso 9db61e5235 Refactored infeence to allow multiple requests through gradio před 1 rokem
  Thomas Robinson fd9f52f710 Modify prompt_format_utils with changes necessary for Llama Guard 3 (#1) před 1 rokem