Commit History

Автор SHA1 Съобщение Дата
  Justin Lee 4768a41a20 merge utils, added configs and sample notebook to run optimizer преди 6 месеца
  Justin Lee 3174e5bd2a code handoff преди 7 месеца
  Justin Lee 423231e139 updated mmlu and harness преди 7 месеца
  Justin Lee 52c5a76165 made changes to utils преди 7 месеца
  Justin Lee 7a014b3e00 update readme преди 7 месеца
  Justin Lee d4638ba575 updated gitignore преди 7 месеца
  Justin Lee d214437e3e Stop tracking files in eval_results/meta-llama__Llama-3.3-70B-Instruct преди 7 месеца
  Justin Lee e1d64ca2f4 update gitignore, added mmlu 0shot and ran a bunch of test преди 7 месеца
  Justin Lee 479b1fbbd7 updated mmlu meta-eval for prompt migration преди 7 месеца
  Justin Lee caeddccb8d update utils преди 7 месеца
  Justin Lee f8a6c7d79f running mmlu pro with meta eval - fixed error преди 7 месеца
  Chester Hu 07b191b17e Merge pull request #2 from pia-papanna/tools-refactory-chester преди 1 година
  Justin Lee dc406b4769 setup meta-eval for benchmark, ray error преди 7 месеца
  Justin Lee 21e04c29bf update mmlu pro преди 7 месеца
  Justin Lee e19b9e9e34 added fix split, gitignore and download mmlu script преди 7 месеца
  Justin Lee 8d3a0479e5 updated env file преди 7 месеца
  Justin Lee 9ffb292272 added inspect and modified harness преди 7 месеца
  Justin Lee eea96618cf batching and parallelization, ran on baseline and lite преди 7 месеца
  Justin Lee 4fd5f29414 revert to previous changes преди 7 месеца
  Justin Lee a6f448f362 <Replace this line with a title. Use 1 line only, 67 chars or less> преди 7 месеца
  Justin Lee becbe77ff3 attempt to fix json output format in eval преди 7 месеца
  Justin Lee 03f2b8eddd change gpu parallel size docs преди 7 месеца
  Justin Lee 0bec41f86a updated readme преди 7 месеца
  Justin Lee 2776a35314 harness runcode преди 8 месеца
  Justin Lee 314b6a874a added updated llama-mmlu-pro and added human-eva преди 8 месеца
  Justin Lee 5730a84b8a beef up readme преди 8 месеца
  Justin Lee 62b53676fb update harness notebook преди 8 месеца
  Justin Lee 1e4c6d22dd update harness notebook преди 8 месеца
  Justin Lee e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation преди 8 месеца
  Justin Lee 4d75fe97b5 update dir преди 8 месеца