Commit Verlauf

Autor SHA1 Nachricht Datum
  Suraj 4be3eb0d17 Updates HF model_ids and readmes for 3.1 vor 1 Jahr
  Matthias Reso c9ae014459 Enable pipeline parallelism through use of AsyncLLMEngine in vllm inferecen + enable use of lora adapter vor 1 Jahr
  Suraj d1d08f9b82 Update promptguard model-id vor 1 Jahr
  Suraj 308026aad5 Adds tentative llamaguard HF model id, eos_token_id for model.generate vor 1 Jahr
  Matthias Reso 0920b1a415 Fix quantization for inference vor 1 Jahr
  Matthias Reso b36830fdf6 Fix reading in stdin for chat_completion, remove padding as we're feeding single samples vor 1 Jahr
  Matthias Reso f0aa8e31ca Update url vor 1 Jahr
  Matthias Reso 9db61e5235 Refactored infeence to allow multiple requests through gradio vor 1 Jahr
  Thomas Robinson fd9f52f710 Modify prompt_format_utils with changes necessary for Llama Guard 3 (#1) vor 1 Jahr
  Cyrus Nikolaidis 0c57646481 Prompt Guard Tutorial vor 1 Jahr
  Suraj Subramanian d3d2cadc4d Update links in README.md (#589) vor 1 Jahr
  Suraj Subramanian 7dcc7307d8 Fix relative links to images (#596) vor 1 Jahr
  Suraj Subramanian a4b6a55aaf Fix broken image link (#597) vor 1 Jahr
  Suraj Subramanian 5b3aaa038c Fix broken image link vor 1 Jahr
  Suraj Subramanian 78b4a7fcff Fix relative links to images vor 1 Jahr
  Hamid Shojanazeri 808a3f7a0c Adding support for FSDP+Qlora. (#572) vor 1 Jahr
  Jeff Tang ba447971f0 Port of DLAI LlamaIndex Agent short course lessons 2-4 to use Llama 3 (#594) vor 1 Jahr
  Jeff Tang 935ad46a0d wordlist update for DLAI LlamaIndex Agent short course vor 1 Jahr
  Jeff Tang af8838463e added lesson summary in each notebook and README vor 1 Jahr
  Jeff Tang aaeba04bd6 README update vor 1 Jahr
  Jeff Tang 353ceaae74 fix of cell order issue for L3 vor 1 Jahr
  dongwang218 ed3136f117 Update hf weight conversion script to llama 3 (#551) vor 1 Jahr
  Kai Wu f6617fb86a changed --pure_bf16 to --fsdp_config.pure_bf16 and corrected "examples/" path (#587) vor 1 Jahr
  Kai Wu 5739231b14 rebased to main, and changed readme vor 1 Jahr
  Kai Wu 81e8a1374a Merge branch 'main' into raft vor 1 Jahr
  Jeff Tang 2e4ea5b728 cell cleanup vor 1 Jahr
  Jeff Tang 0fef52e846 README links fixed vor 1 Jahr
  Jeff Tang ebbf362576 L4 - replace groq with fireworks to fix rate limit vor 1 Jahr
  Jeff Tang 945175a2ea l3 cleanup vor 1 Jahr
  Jeff Tang b585e1f211 L2 llm fix - use fireworks llama 3 to overcome the groq rate limit vor 1 Jahr