1 year ago · 6ff1184120
--- a/.github/scripts/check_copyright_header.py
+++ b/.github/scripts/check_copyright_header.py
@@ -11,7 +11,7 @@ HEADER = """# Copyright (c) Meta Platforms, Inc. and affiliates.
 
				 # This software may be used and distributed according to the terms of the Llama 2 Community License Agreement.\n\n"""
			
 
				 
			
 
				 #Files in black list must be relative to main repo folder
			
 
				-BLACKLIST = ["eval/open_llm_leaderboard/hellaswag_utils.py"]
			
 
				+BLACKLIST = ["tools/benchmarks/llm_eval_harness/open_llm_leaderboard/hellaswag_utils.py"]
			
 
				 
			
 
				 if __name__ == "__main__":
			
 
				     for ext in ["*.py", "*.sh"]:
			
--- a/recipes/README.md
+++ b/recipes/README.md
@@ -11,4 +11,3 @@ This folder contains examples organized by topic:
 
				 [llama_api_providers](./llama_api_providers)|Scripts to run inference on Llama via hosted endpoints
			
 
				 [benchmarks](./benchmarks)|Scripts to benchmark Llama 3 models inference on various backends
			
 
				 [code_llama](./code_llama)|Scripts to run inference with the Code Llama models
			
 
				-[evaluation](./evaluation)|Scripts to evaluate fine-tuned Llama 3 models using `lm-evaluation-harness` from `EleutherAI`
			
--- a/recipes/benchmarks/inference_throughput/tokenizer/special_tokens_map.json
+++ b/recipes/benchmarks/inference_throughput/tokenizer/special_tokens_map.json
@@ -1,23 +0,0 @@
 
				-{
			
 
				-  "bos_token": {
			
 
				-    "content": "<s>",
			
 
				-    "lstrip": false,
			
 
				-    "normalized": true,
			
 
				-    "rstrip": false,
			
 
				-    "single_word": false
			
 
				-  },
			
 
				-  "eos_token": {
			
 
				-    "content": "</s>",
			
 
				-    "lstrip": false,
			
 
				-    "normalized": true,
			
 
				-    "rstrip": false,
			
 
				-    "single_word": false
			
 
				-  },
			
 
				-  "unk_token": {
			
 
				-    "content": "<unk>",
			
 
				-    "lstrip": false,
			
 
				-    "normalized": true,
			
 
				-    "rstrip": false,
			
 
				-    "single_word": false
			
 
				-  }
			
 
				-}
			
--- a/recipes/benchmarks/inference_throughput/tokenizer/tokenizer.json
+++ b/recipes/benchmarks/inference_throughput/tokenizer/tokenizer.json
--- a/recipes/benchmarks/inference_throughput/tokenizer/tokenizer.model
+++ b/recipes/benchmarks/inference_throughput/tokenizer/tokenizer.model
--- a/recipes/benchmarks/inference_throughput/tokenizer/tokenizer_config.json
+++ b/recipes/benchmarks/inference_throughput/tokenizer/tokenizer_config.json
@@ -1,35 +0,0 @@
 
				-{
			
 
				-  "add_bos_token": true,
			
 
				-  "add_eos_token": false,
			
 
				-  "bos_token": {
			
 
				-    "__type": "AddedToken",
			
 
				-    "content": "<s>",
			
 
				-    "lstrip": false,
			
 
				-    "normalized": true,
			
 
				-    "rstrip": false,
			
 
				-    "single_word": false
			
 
				-  },
			
 
				-  "clean_up_tokenization_spaces": false,
			
 
				-  "eos_token": {
			
 
				-    "__type": "AddedToken",
			
 
				-    "content": "</s>",
			
 
				-    "lstrip": false,
			
 
				-    "normalized": true,
			
 
				-    "rstrip": false,
			
 
				-    "single_word": false
			
 
				-  },
			
 
				-  "legacy": true,
			
 
				-  "use_default_system_prompt": false,
			
 
				-  "model_max_length": 1000000000000000019884624838656,
			
 
				-  "pad_token": null,
			
 
				-  "sp_model_kwargs": {},
			
 
				-  "tokenizer_class": "LlamaTokenizerFast",
			
 
				-  "unk_token": {
			
 
				-    "__type": "AddedToken",
			
 
				-    "content": "<unk>",
			
 
				-    "lstrip": false,
			
 
				-    "normalized": true,
			
 
				-    "rstrip": false,
			
 
				-    "single_word": false
			
 
				-  }
			
 
				-}
			
--- a/recipes/benchmarks/inference_throughput/README.md
+++ b/recipes/benchmarks/inference_throughput/README.md
--- a/recipes/benchmarks/inference_throughput/cloud-api/README.md
+++ b/recipes/benchmarks/inference_throughput/cloud-api/README.md
--- a/tools/benchmarks/inference/cloud/aws/fmbench/README.md
+++ b/tools/benchmarks/inference/cloud/aws/fmbench/README.md
--- a/tools/benchmarks/inference/cloud/aws/fmbench/config.yml
+++ b/tools/benchmarks/inference/cloud/aws/fmbench/config.yml
--- a/tools/benchmarks/inference/cloud/aws/fmbench/img/CFT.png
+++ b/tools/benchmarks/inference/cloud/aws/fmbench/img/CFT.png
--- a/tools/benchmarks/inference/cloud/aws/fmbench/img/business_summary.png
+++ b/tools/benchmarks/inference/cloud/aws/fmbench/img/business_summary.png
--- a/tools/benchmarks/inference/cloud/aws/fmbench/img/instances.png
+++ b/tools/benchmarks/inference/cloud/aws/fmbench/img/instances.png
--- a/tools/benchmarks/inference/cloud/aws/fmbench/img/latency_vs_tokens.png
+++ b/tools/benchmarks/inference/cloud/aws/fmbench/img/latency_vs_tokens.png
--- a/recipes/benchmarks/inference_throughput/cloud-api/azure/chat_azure_api_benchmark.py
+++ b/recipes/benchmarks/inference_throughput/cloud-api/azure/chat_azure_api_benchmark.py
--- a/recipes/benchmarks/inference_throughput/cloud-api/azure/input.jsonl
+++ b/recipes/benchmarks/inference_throughput/cloud-api/azure/input.jsonl
--- a/recipes/benchmarks/inference_throughput/cloud-api/azure/parameters.json
+++ b/recipes/benchmarks/inference_throughput/cloud-api/azure/parameters.json
--- a/recipes/benchmarks/inference_throughput/cloud-api/azure/pretrained_azure_api_benchmark.py
+++ b/recipes/benchmarks/inference_throughput/cloud-api/azure/pretrained_azure_api_benchmark.py
--- a/recipes/benchmarks/inference_throughput/on-prem/README.md
+++ b/recipes/benchmarks/inference_throughput/on-prem/README.md
--- a/recipes/benchmarks/inference_throughput/on-prem/vllm/chat_vllm_benchmark.py
+++ b/recipes/benchmarks/inference_throughput/on-prem/vllm/chat_vllm_benchmark.py
--- a/recipes/benchmarks/inference_throughput/on-prem/vllm/input.jsonl
+++ b/recipes/benchmarks/inference_throughput/on-prem/vllm/input.jsonl
--- a/recipes/benchmarks/inference_throughput/on-prem/vllm/parameters.json
+++ b/recipes/benchmarks/inference_throughput/on-prem/vllm/parameters.json
--- a/recipes/benchmarks/inference_throughput/on-prem/vllm/pretrained_vllm_benchmark.py
+++ b/recipes/benchmarks/inference_throughput/on-prem/vllm/pretrained_vllm_benchmark.py
--- a/recipes/benchmarks/inference_throughput/requirements.txt
+++ b/recipes/benchmarks/inference_throughput/requirements.txt
--- a/tools/benchmarks/llm_eval_harness/README.md
+++ b/tools/benchmarks/llm_eval_harness/README.md
--- a/tools/benchmarks/llm_eval_harness/eval.py
+++ b/tools/benchmarks/llm_eval_harness/eval.py
--- a/tools/benchmarks/llm_eval_harness/open_llm_eval_prep.sh
+++ b/tools/benchmarks/llm_eval_harness/open_llm_eval_prep.sh
--- a/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/arc_challeneg_25shots.yaml
+++ b/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/arc_challeneg_25shots.yaml
--- a/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/hellaswag_10shots.yaml
+++ b/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/hellaswag_10shots.yaml
--- a/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/hellaswag_utils.py
+++ b/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/hellaswag_utils.py
--- a/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/mmlu_5shots.yaml
+++ b/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/mmlu_5shots.yaml
--- a/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/winogrande_5shots.yaml
+++ b/tools/benchmarks/llm_eval_harness/open_llm_leaderboard/winogrande_5shots.yaml