Justin Lee 2776a35314 harness runcode 7 tháng trước cách đây
..
__init__.py e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation 8 tháng trước cách đây
datatypes.py e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation 8 tháng trước cách đây
helpers.py e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation 8 tháng trước cách đây
humaneval.py 314b6a874a added updated llama-mmlu-pro and added human-eva 8 tháng trước cách đây
leaderboard_mmlu_pro.py e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation 8 tháng trước cách đây
llama_mmlu_pro.py 2776a35314 harness runcode 7 tháng trước cách đây