.. |
__init__.py
|
207d2f80e9
Make code-llama and hf-tgi inference runnable as module
|
hace 2 años |
chat_utils.py
|
6d9d48d619
Use apply_chat_template instead of custom functions
|
hace 1 año |
checkpoint_converter_fsdp_hf.py
|
0e54f5634a
use AutoTokenizer instead of LlamaTokenizer
|
hace 1 año |
llm.py
|
eeb45e5f2c
Updated model names for OctoAI
|
hace 1 año |
model_utils.py
|
d51d2cce9c
adding sdpa for flash attn
|
hace 1 año |
prompt_format_utils.py
|
fd9f52f710
Modify prompt_format_utils with changes necessary for Llama Guard 3 (#1)
|
hace 1 año |
safety_utils.py
|
f63ba19827
Fixing tokenizer used for llama 3. Changing quantization configs on safety_utils.
|
hace 1 año |