This website works better with JavaScript
Startsida
Utforska
Hjälp
Logga in
Dept02
/
llm-evals
Bevaka
8
Stjärnmärk
0
Fork
0
Filer
Ärenden
0
Pull-förfrågningar
0
Wiki
Träd:
e3f0e20ca5
Grenar
Taggar
main
llm-evals
/
llmeval
/
commons
/
management
/
commands
Radu Boncea
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 år sedan
..
__init__.py
e935566895
initial commit
1 år sedan
clean_pubmedqa_dataset.py
e935566895
initial commit
1 år sedan
clean_qa.py
e935566895
initial commit
1 år sedan
eval_qa.py
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 år sedan
export_results.py
e935566895
initial commit
1 år sedan
import_medqa.py
e935566895
initial commit
1 år sedan
import_mmlu.py
e935566895
initial commit
1 år sedan
import_pubmedqa.py
e935566895
initial commit
1 år sedan