Commit History

Автор SHA1 Съобщение Дата
  Justin Lee dc406b4769 setup meta-eval for benchmark, ray error преди 7 месеца
  Justin Lee 9ffb292272 added inspect and modified harness преди 7 месеца
  Justin Lee eea96618cf batching and parallelization, ran on baseline and lite преди 7 месеца
  Justin Lee becbe77ff3 attempt to fix json output format in eval преди 7 месеца
  Justin Lee 2776a35314 harness runcode преди 8 месеца
  Justin Lee 62b53676fb update harness notebook преди 8 месеца
  Justin Lee e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation преди 8 месеца