Suraj
|
a9e8f810e7
Merge branch 'main' of https://github.com/meta-llama/llama-recipes-alpha into hf_model_id
|
1 рік тому |
Matthias Reso
|
e2f77dbc21
fix quant config
|
1 рік тому |
Matthias Reso
|
6ef9a78458
Fix issues with quantization_config == None
|
1 рік тому |
Matthias Reso
|
b319a9fb8c
Fix lint issue
|
1 рік тому |
Matthias Reso
|
a3fd369127
Ref from infernce recipes to vllm for 405B
|
1 рік тому |
Matthias Reso
|
a8f2267324
Added multi node doc to multigpu_finetuning.md
|
1 рік тому |
Matthias Reso
|
afb3b75892
Add 405B + QLoRA + FSDP to multi_gpu.md doc
|
1 рік тому |
Matthias Reso
|
939c88fb04
Add 405B + QLoRA ref to LLM finetung
|
1 рік тому |
Matthias Reso
|
d2fd9c163a
Added doc for multi-node vllm inference
|
1 рік тому |
Thomas Robinson
|
1a183c0a5e
Introduce Llama guard customization notebook and associated dataset loader example
|
1 рік тому |
Cyrus Nikolaidis
|
301e51a340
Merge branch 'main' of github.com:meta-llama/llama-recipes-alpha
|
1 рік тому |
Cyrus Nikolaidis
|
883def17f0
Prompt Guard Inference for long strings
|
1 рік тому |
Suraj Subramanian
|
0d00616b34
Move MediaGen notebook to octoai folder (#601)
|
1 рік тому |
Suraj Subramanian
|
5a9858f0f0
Update README.md to remove mediagen reference
|
1 рік тому |
Suraj Subramanian
|
5a878654ec
Move MediaGen notebook to octoai folder
|
1 рік тому |
Suraj
|
4be3eb0d17
Updates HF model_ids and readmes for 3.1
|
1 рік тому |
Matthias Reso
|
c9ae014459
Enable pipeline parallelism through use of AsyncLLMEngine in vllm inferecen + enable use of lora adapter
|
1 рік тому |
Suraj
|
d1d08f9b82
Update promptguard model-id
|
1 рік тому |
Suraj
|
308026aad5
Adds tentative llamaguard HF model id, eos_token_id for model.generate
|
1 рік тому |
Matthias Reso
|
0920b1a415
Fix quantization for inference
|
1 рік тому |
Matthias Reso
|
b36830fdf6
Fix reading in stdin for chat_completion, remove padding as we're feeding single samples
|
1 рік тому |
Matthias Reso
|
f0aa8e31ca
Update url
|
1 рік тому |
Matthias Reso
|
9db61e5235
Refactored infeence to allow multiple requests through gradio
|
1 рік тому |
Thomas Robinson
|
fd9f52f710
Modify prompt_format_utils with changes necessary for Llama Guard 3 (#1)
|
1 рік тому |
Cyrus Nikolaidis
|
0c57646481
Prompt Guard Tutorial
|
1 рік тому |
Suraj Subramanian
|
d3d2cadc4d
Update links in README.md (#589)
|
1 рік тому |
Suraj Subramanian
|
7dcc7307d8
Fix relative links to images (#596)
|
1 рік тому |
Suraj Subramanian
|
a4b6a55aaf
Fix broken image link (#597)
|
1 рік тому |
Suraj Subramanian
|
5b3aaa038c
Fix broken image link
|
1 рік тому |
Suraj Subramanian
|
78b4a7fcff
Fix relative links to images
|
1 рік тому |