This website works better with JavaScript
Ana Sayfa
Keşfet
Yardım
Giriş Yap
Dept02
/
llm-evals
İzle
8
Yıldızla
0
Çatalla
0
Dosyalar
Sorunlar
0
Değişiklik İstekleri
0
Wiki
Ağaç:
e3f0e20ca5
Dallar
Biçim İmleri
main
llm-evals
/
llmeval
/
commons
/
management
/
commands
Radu Boncea
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 yıl önce
..
__init__.py
e935566895
initial commit
1 yıl önce
clean_pubmedqa_dataset.py
e935566895
initial commit
1 yıl önce
clean_qa.py
e935566895
initial commit
1 yıl önce
eval_qa.py
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 yıl önce
export_results.py
e935566895
initial commit
1 yıl önce
import_medqa.py
e935566895
initial commit
1 yıl önce
import_mmlu.py
e935566895
initial commit
1 yıl önce
import_pubmedqa.py
e935566895
initial commit
1 yıl önce