|
|
5 tháng trước cách đây | |
|---|---|---|
| .. | ||
| evals_synthetic_data | 5 tháng trước cách đây | |
| inference | 8 tháng trước cách đây | |
| llm_eval_harness | 8 tháng trước cách đây | |
| README.md | 9 tháng trước cách đây | |
lm-evaluation-harness, a tool to evaluate Llama models including quantized models focusing on quality. We also included a recipe that calculates Llama 3.1 evaluation metrics Using lm-evaluation-harness and instructions that calculate HuggingFace Open LLM Leaderboard v2 metrics.