This website works better with JavaScript
ホーム
エクスプローラ
ヘルプ
サインイン
Dept02
/
llm-evals
Watch
8
Star
0
Fork
0
ファイル
課題
0
プルリクエスト
0
Wiki
ツリー:
e3f0e20ca5
ブランチ
タグ
main
llm-evals
/
llmeval
/
commons
/
management
/
commands
Radu Boncea
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 年間 前
..
__init__.py
e935566895
initial commit
1 年間 前
clean_pubmedqa_dataset.py
e935566895
initial commit
1 年間 前
clean_qa.py
e935566895
initial commit
1 年間 前
eval_qa.py
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 年間 前
export_results.py
e935566895
initial commit
1 年間 前
import_medqa.py
e935566895
initial commit
1 年間 前
import_mmlu.py
e935566895
initial commit
1 年間 前
import_pubmedqa.py
e935566895
initial commit
1 年間 前