John Lockman 9fb395a4f5 Delete k8s-TensorFlow-resnet50-multinode-MPIOperator.yaml | hace 2 años | |
---|---|---|
.. | ||
PyTorch | hace 2 años | |
TensorRT-InferenceServer | hace 4 años | |
login_node_example | hace 3 años | |
README.md | hace 4 años | |
device_ip_list.yml | hace 2 años | |
host_inventory_file | hace 3 años | |
host_inventory_file.ini | hace 3 años | |
host_mapping_file_one_touch.csv | hace 3 años | |
host_mapping_file_os_provisioning.csv | hace 3 años | |
k8s-tensorflow-nvidia-ngc-resnet50-multinode-mpioperator.yaml | hace 4 años | |
mapping_device_file.csv | hace 3 años | |
slurm-TensorFlow-resnet50-multinode-MPI.batch | hace 4 años |
The examples K8s Submit and SLURM submit are provide as examples for running the resnet50 benchmark with TensorFlow on 8 GPUs using 2 C4140s.
kubectl create -f k8s-TensorFlow-resnet50-multinode-MPIOperator.yaml
sbatch slurm-TensorFlow-resnet50-multinode-MPI.batch