Commit Verlauf

Autor SHA1 Nachricht Datum
  Matthias Reso a3fd369127 Ref from infernce recipes to vllm for 405B vor 1 Jahr
  Matthias Reso a8f2267324 Added multi node doc to multigpu_finetuning.md vor 1 Jahr
  Matthias Reso afb3b75892 Add 405B + QLoRA + FSDP to multi_gpu.md doc vor 1 Jahr
  Matthias Reso 939c88fb04 Add 405B + QLoRA ref to LLM finetung vor 1 Jahr
  Matthias Reso d2fd9c163a Added doc for multi-node vllm inference vor 1 Jahr
  Matthias Reso c9ae014459 Enable pipeline parallelism through use of AsyncLLMEngine in vllm inferecen + enable use of lora adapter vor 1 Jahr
  Matthias Reso 0920b1a415 Fix quantization for inference vor 1 Jahr
  Matthias Reso b36830fdf6 Fix reading in stdin for chat_completion, remove padding as we're feeding single samples vor 1 Jahr
  Matthias Reso f0aa8e31ca Update url vor 1 Jahr
  Matthias Reso 9db61e5235 Refactored infeence to allow multiple requests through gradio vor 1 Jahr
  Thomas Robinson fd9f52f710 Modify prompt_format_utils with changes necessary for Llama Guard 3 (#1) vor 1 Jahr
  Cyrus Nikolaidis 0c57646481 Prompt Guard Tutorial vor 1 Jahr
  Hamid Shojanazeri 808a3f7a0c Adding support for FSDP+Qlora. (#572) vor 1 Jahr
  Jeff Tang ba447971f0 Port of DLAI LlamaIndex Agent short course lessons 2-4 to use Llama 3 (#594) vor 1 Jahr
  Jeff Tang 935ad46a0d wordlist update for DLAI LlamaIndex Agent short course vor 1 Jahr
  Jeff Tang af8838463e added lesson summary in each notebook and README vor 1 Jahr
  Jeff Tang aaeba04bd6 README update vor 1 Jahr
  Jeff Tang 353ceaae74 fix of cell order issue for L3 vor 1 Jahr
  dongwang218 ed3136f117 Update hf weight conversion script to llama 3 (#551) vor 1 Jahr
  Kai Wu f6617fb86a changed --pure_bf16 to --fsdp_config.pure_bf16 and corrected "examples/" path (#587) vor 1 Jahr
  Jeff Tang 2e4ea5b728 cell cleanup vor 1 Jahr
  Jeff Tang 0fef52e846 README links fixed vor 1 Jahr
  Jeff Tang ebbf362576 L4 - replace groq with fireworks to fix rate limit vor 1 Jahr
  Jeff Tang 945175a2ea l3 cleanup vor 1 Jahr
  Jeff Tang b585e1f211 L2 llm fix - use fireworks llama 3 to overcome the groq rate limit vor 1 Jahr
  Jeff Tang c87fb189f7 Building_Agentic_RAG_with_Llamaindex L2,3,4 and README vor 1 Jahr
  Jeff Tang 7bb72efcc8 colab links fixed for dlai agents notebooks (#593) vor 1 Jahr
  Jeff Tang cc569ef52b colab links fixed vor 1 Jahr
  Jeff Tang 89cb5d0a8f dlai_agentic_rag all lesson notebooks vor 1 Jahr
  Jeff Tang 43b7754b2c 4 notebooks ported from 4 DLAI agent short courses using Llama 3 (#560) vor 1 Jahr