Historie revizí

Autor SHA1 Zpráva Datum
  Matthias Reso c167945448 remove 405B ft doc před 1 rokem
  Matthias Reso b0b4e16aec Update docs/multi_gpu.md před 1 rokem
  Matthias Reso e2f77dbc21 fix quant config před 1 rokem
  Matthias Reso 6ef9a78458 Fix issues with quantization_config == None před 1 rokem
  Matthias Reso b319a9fb8c Fix lint issue před 1 rokem
  Matthias Reso a3fd369127 Ref from infernce recipes to vllm for 405B před 1 rokem
  Matthias Reso a8f2267324 Added multi node doc to multigpu_finetuning.md před 1 rokem
  Matthias Reso afb3b75892 Add 405B + QLoRA + FSDP to multi_gpu.md doc před 1 rokem
  Matthias Reso 939c88fb04 Add 405B + QLoRA ref to LLM finetung před 1 rokem
  Matthias Reso d2fd9c163a Added doc for multi-node vllm inference před 1 rokem
  Matthias Reso c9ae014459 Enable pipeline parallelism through use of AsyncLLMEngine in vllm inferecen + enable use of lora adapter před 1 rokem
  Matthias Reso 0920b1a415 Fix quantization for inference před 1 rokem
  Matthias Reso b36830fdf6 Fix reading in stdin for chat_completion, remove padding as we're feeding single samples před 1 rokem
  Matthias Reso f0aa8e31ca Update url před 1 rokem
  Matthias Reso 9db61e5235 Refactored infeence to allow multiple requests through gradio před 1 rokem
  Thomas Robinson fd9f52f710 Modify prompt_format_utils with changes necessary for Llama Guard 3 (#1) před 1 rokem
  Cyrus Nikolaidis 0c57646481 Prompt Guard Tutorial před 1 rokem
  Hamid Shojanazeri 808a3f7a0c Adding support for FSDP+Qlora. (#572) před 1 rokem
  Jeff Tang ba447971f0 Port of DLAI LlamaIndex Agent short course lessons 2-4 to use Llama 3 (#594) před 1 rokem
  Jeff Tang 935ad46a0d wordlist update for DLAI LlamaIndex Agent short course před 1 rokem
  Jeff Tang af8838463e added lesson summary in each notebook and README před 1 rokem
  Jeff Tang aaeba04bd6 README update před 1 rokem
  Jeff Tang 353ceaae74 fix of cell order issue for L3 před 1 rokem
  dongwang218 ed3136f117 Update hf weight conversion script to llama 3 (#551) před 1 rokem
  Kai Wu f6617fb86a changed --pure_bf16 to --fsdp_config.pure_bf16 and corrected "examples/" path (#587) před 1 rokem
  Jeff Tang 2e4ea5b728 cell cleanup před 1 rokem
  Jeff Tang 0fef52e846 README links fixed před 1 rokem
  Jeff Tang ebbf362576 L4 - replace groq with fireworks to fix rate limit před 1 rokem
  Jeff Tang 945175a2ea l3 cleanup před 1 rokem
  Jeff Tang b585e1f211 L2 llm fix - use fireworks llama 3 to overcome the groq rate limit před 1 rokem