Revīziju vēsture

Autors SHA1 Ziņojums Datums
  Justin Lee 423231e139 updated mmlu and harness 11 mēneši atpakaļ
  Justin Lee 52c5a76165 made changes to utils 11 mēneši atpakaļ
  Justin Lee 7a014b3e00 update readme 11 mēneši atpakaļ
  Justin Lee d4638ba575 updated gitignore 11 mēneši atpakaļ
  Justin Lee d214437e3e Stop tracking files in eval_results/meta-llama__Llama-3.3-70B-Instruct 11 mēneši atpakaļ
  Justin Lee e1d64ca2f4 update gitignore, added mmlu 0shot and ran a bunch of test 11 mēneši atpakaļ
  Justin Lee 479b1fbbd7 updated mmlu meta-eval for prompt migration 11 mēneši atpakaļ
  Justin Lee caeddccb8d update utils 11 mēneši atpakaļ
  Justin Lee f8a6c7d79f running mmlu pro with meta eval - fixed error 11 mēneši atpakaļ
  Chester Hu 07b191b17e Merge pull request #2 from pia-papanna/tools-refactory-chester 1 gadu atpakaļ
  Justin Lee dc406b4769 setup meta-eval for benchmark, ray error 11 mēneši atpakaļ
  Justin Lee 21e04c29bf update mmlu pro 11 mēneši atpakaļ
  Justin Lee e19b9e9e34 added fix split, gitignore and download mmlu script 11 mēneši atpakaļ
  Justin Lee 8d3a0479e5 updated env file 11 mēneši atpakaļ
  Justin Lee 9ffb292272 added inspect and modified harness 11 mēneši atpakaļ
  Justin Lee eea96618cf batching and parallelization, ran on baseline and lite 11 mēneši atpakaļ
  Justin Lee 4fd5f29414 revert to previous changes 11 mēneši atpakaļ
  Justin Lee a6f448f362 <Replace this line with a title. Use 1 line only, 67 chars or less> 11 mēneši atpakaļ
  Justin Lee becbe77ff3 attempt to fix json output format in eval 11 mēneši atpakaļ
  Justin Lee 03f2b8eddd change gpu parallel size docs 11 mēneši atpakaļ
  Justin Lee 0bec41f86a updated readme 11 mēneši atpakaļ
  Justin Lee 2776a35314 harness runcode 11 mēneši atpakaļ
  Justin Lee 314b6a874a added updated llama-mmlu-pro and added human-eva 11 mēneši atpakaļ
  Justin Lee 5730a84b8a beef up readme 11 mēneši atpakaļ
  Justin Lee 62b53676fb update harness notebook 11 mēneši atpakaļ
  Justin Lee 1e4c6d22dd update harness notebook 11 mēneši atpakaļ
  Justin Lee e52e1d1ab4 updated prompt migration to use benchmark and also mipro, added meta implementation 11 mēneši atpakaļ
  Justin Lee 4d75fe97b5 update dir 11 mēneši atpakaļ
  Justin Lee 90d16cd7de minor changes in eval, deleted formatter 1 gadu atpakaļ
  Justin Lee b85811d0b9 change eval dataset, include more robust judging, improved main 1 gadu atpakaļ