.. |
__init__.py
|
207d2f80e9
Make code-llama and hf-tgi inference runnable as module
|
hace 2 años |
chat_utils.py
|
6d9d48d619
Use apply_chat_template instead of custom functions
|
hace 1 año |
checkpoint_converter_fsdp_hf.py
|
0e54f5634a
use AutoTokenizer instead of LlamaTokenizer
|
hace 1 año |
llm.py
|
a404c9249c
Notebook to demonstrate using llama and llama-guard together using OctoAI
|
hace 1 año |
model_utils.py
|
d51d2cce9c
adding sdpa for flash attn
|
hace 1 año |
prompt_format_utils.py
|
bcdb5b31fe
Fixing quantization config. Removing prints
|
hace 1 año |
safety_utils.py
|
f63ba19827
Fixing tokenizer used for llama 3. Changing quantization configs on safety_utils.
|
hace 1 año |