Historie revizí

Autor SHA1 Zpráva Datum
  Justin Lee dc406b4769 setup meta-eval for benchmark, ray error před 7 měsíci
  Justin Lee 21e04c29bf update mmlu pro před 7 měsíci
  Justin Lee e19b9e9e34 added fix split, gitignore and download mmlu script před 7 měsíci
  Justin Lee 4fd5f29414 revert to previous changes před 7 měsíci
  Justin Lee becbe77ff3 attempt to fix json output format in eval před 7 měsíci
  Justin Lee 2776a35314 harness runcode před 8 měsíci
  Justin Lee 314b6a874a added updated llama-mmlu-pro and added human-eva před 8 měsíci
  Justin Lee e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation před 8 měsíci