| .. |
|
__pycache__
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
data
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
fp16_deprecated
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
fused_kernels
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
model
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
mpu
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
optimizer
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
tokenizer
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
__init__.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
arguments.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
checkpointing.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
global_vars.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
indexer.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
initialize.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
learning_rates.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
memory.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
microbatches.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
p2p_communication.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
package_info.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
schedules.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
text_generation_utils.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
training.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
training_original.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |
|
utils.py
|
a807fe3a90
Swedish GPTBootcamp tutorials
|
4 vuotta sitten |