This website works better with JavaScript
홈
탐색
도움말
로그인
Dept02
/
llm-evals
Watch
8
Star
0
포크
0
파일
이슈
0
풀 리퀘스트
0
위키
트리:
e3f0e20ca5
브랜치
태그
main
llm-evals
/
llmeval
/
commons
/
management
/
commands
Radu Boncea
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 년 전
..
__init__.py
e935566895
initial commit
1 년 전
clean_pubmedqa_dataset.py
e935566895
initial commit
1 년 전
clean_qa.py
e935566895
initial commit
1 년 전
eval_qa.py
7887d98fd0
chore: Add support for Togheter.ai and Groq clients
1 년 전
export_results.py
e935566895
initial commit
1 년 전
import_medqa.py
e935566895
initial commit
1 년 전
import_mmlu.py
e935566895
initial commit
1 년 전
import_pubmedqa.py
e935566895
initial commit
1 년 전