.. |
bbh
|
dc406b4769
setup meta-eval for benchmark, ray error
|
7 tháng trước cách đây |
gpqa
|
dc406b4769
setup meta-eval for benchmark, ray error
|
7 tháng trước cách đây |
gpqa_cot
|
dc406b4769
setup meta-eval for benchmark, ray error
|
7 tháng trước cách đây |
ifeval
|
dc406b4769
setup meta-eval for benchmark, ray error
|
7 tháng trước cách đây |
math_hard
|
dc406b4769
setup meta-eval for benchmark, ray error
|
7 tháng trước cách đây |
mmlu
|
3174e5bd2a
code handoff
|
7 tháng trước cách đây |
mmlu_pro
|
423231e139
updated mmlu and harness
|
7 tháng trước cách đây |
meta_instruct.yaml
|
3174e5bd2a
code handoff
|
7 tháng trước cách đây |
meta_pretrain.yaml
|
dc406b4769
setup meta-eval for benchmark, ray error
|
7 tháng trước cách đây |