Justin Lee 3174e5bd2a code handoff 7 tháng trước cách đây
..
bbh dc406b4769 setup meta-eval for benchmark, ray error 7 tháng trước cách đây
gpqa dc406b4769 setup meta-eval for benchmark, ray error 7 tháng trước cách đây
gpqa_cot dc406b4769 setup meta-eval for benchmark, ray error 7 tháng trước cách đây
ifeval dc406b4769 setup meta-eval for benchmark, ray error 7 tháng trước cách đây
math_hard dc406b4769 setup meta-eval for benchmark, ray error 7 tháng trước cách đây
mmlu 3174e5bd2a code handoff 7 tháng trước cách đây
mmlu_pro 423231e139 updated mmlu and harness 7 tháng trước cách đây
meta_instruct.yaml 3174e5bd2a code handoff 7 tháng trước cách đây
meta_pretrain.yaml dc406b4769 setup meta-eval for benchmark, ray error 7 tháng trước cách đây