Hamid Shojanazeri
							
						 | 
						
							
							
								41dd7ff1cb
							
							Merge branch 'main' into checkpoint_handler_path_fix
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								31d6ce8bf6
							
							adding expnadable sgement and dist debug flag info
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								a955ed1999
							
							added checks for dist barrier and commented cuda exapnadable segements and dist_dbug
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								a2403c7c1a
							
							clean up
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								e9559d2669
							
							fixing the train/eval_loss calcualtion
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Geeta Chauhan
							
						 | 
						
							
							
								2243b962fa
							
							Create spellcheck.yml (#50)
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Geeta Chauhan
							
						 | 
						
							
							
								3cc2b3787f
							
							Fix broken links in Dataset.md (#49)
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Geeta Chauhan
							
						 | 
						
							
							
								021ed8e312
							
							adding active mem stat (#44)
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Geeta Chauhan
							
						 | 
						
							
							
								09db361d23
							
							Templates updates (#67)
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								4ba4400a75
							
							adding dist barrier before and after checkpointing
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   chauhang
							
						 | 
						
							
							
								95d59afcb8
							
							Update PR template
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   chauhang
							
						 | 
						
							
							
								857a3ade4e
							
							Add PR template
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   chauhang
							
						 | 
						
							
							
								9f9532d34c
							
							comm
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Christian Miller
							
						 | 
						
							
							
								9b2f72e1f5
							
							update README: python 3.8 rec + fix formatting
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								a49a2c2804
							
							adding PT cuda allocation expand flag
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Geeta Chauhan
							
						 | 
						
							
							
								905f633dab
							
							adding issue tempalte (#57)
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								b814704b5f
							
							adding issue tempalte
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								442c1ccf7c
							
							adding barrier to end of trainer loop
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								f74d57dc08
							
							printing scores based on fsdp usage or single gpu
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								3d887ea483
							
							update with active memory and removing rank0 for eval score
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   sekyonda
							
						 | 
						
							
							
								0d9c1a909f
							
							Update markdown_link_check_config.json
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								bedb96b78a
							
							fixing the full state path in checkpoint handler
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   sekyondaMeta
							
						 | 
						
							
							
								b625dceb9b
							
							Create spellcheck.yml
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Kaiser Pister
							
						 | 
						
							
							
								b61c45d31d
							
							Fix broken links in Dataset.md
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								569f8b7976
							
							fixed arg names
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								9e3b1b7f01
							
							fixed arg names
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								4b18e49f44
							
							added steps for conversion of fsdp to Hf
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Geeta Chauhan
							
						 | 
						
							
							
								74bde65a62
							
							Adding Supporting Files For link and Spell Check (#26)
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								a977145a9b
							
							change bf16 default to false
						 | 
						2 jaren geleden | 
					
				
					
						
							
								   Hamid Shojanazeri
							
						 | 
						
							
							
								563e572f7c
							
							adding active mem stat
						 | 
						2 jaren geleden |