|  Kai Wu | 26e877fd42
							
							changed readme, unified the context interface and added get_flops_per_sec() | hace 1 año | 
				
					
						|  Kai Wu | d9558c11ca
							
							changed context name and add more docs | hace 1 año | 
				
					
						|  Kai Wu | 03f1ca7817
							
							fixed some typo to pass spellcheck | hace 1 año | 
				
					
						|  Kai Wu | 7b1a9413d2
							
							fixed a typo | hace 1 año | 
				
					
						|  Kai Wu | 41434dc825
							
							formatted and removed duplicated or unused function get_total_flops() and byte2mb() | hace 1 año | 
				
					
						|  Kai Wu | f2e80bae22
							
							created a FlopMeasure class on top of FlopCounterMode instead of keep of copy of our own tflop_counter.py | hace 1 año | 
				
					
						|  Kai Wu | 69e46887b4
							
							handling incorrect profiling early stop caused by max_train_steps and add profiler.step() for each train step | hace 1 año | 
				
					
						|  Kai Wu | 34e0bf4c6e
							
							second draft of this feature, seems to be working now | hace 1 año | 
				
					
						|  Kai Wu | a35519ee90
							
							fixed typo and handling unexpected exit | hace 1 año | 
				
					
						|  Kai Wu | 2a5de9b448
							
							first draft of flop counter feature | hace 1 año | 
				
					
						|  Kai Wu | e6f69f84ad
							
							add max_steps_reached to reduce redundancy | hace 1 año | 
				
					
						|  Kai Wu | fa0a389f74
							
							add max_step feature for training and eval | hace 1 año | 
				
					
						|  jpgard | 6954b16b3b
							
							only save training params on rank 0 | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 761b7e6e51
							
							adding wandb_run ro eval | hace 1 año | 
				
					
						|  Hamid Shojanazeri | ffdc93f00a
							
							Merge branch 'main' into wandb_logging | hace 1 año | 
				
					
						|  Matthias Reso | c5a382e509
							
							Make tests run on cpu only machines | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 162be4c045
							
							Revert "Flop counter, profiling and GC (#357)" | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 1a09fb5d27
							
							add logging for setting profiler | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 71d137c722
							
							Merge branch 'main' into flop_counter_gc | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 8bf474b455
							
							clean up | hace 1 año | 
				
					
						|  Hamid Shojanazeri | 19089269d3
							
							add gc | hace 1 año | 
				
					
						|  Hamid Shojanazeri | dbfea484c6
							
							Feature : Enable Intel GPU/XPU finetuning and inference (#116) | hace 1 año | 
				
					
						|  Beto | 1f5b202c18
							
							Adding tests for the save_metrics param in the train function | hace 1 año | 
				
					
						|  Beto | 7474514fe0
							
							Merging with main | hace 1 año | 
				
					
						|  gaopengzhi | c7d410725b
							
							Merge branch 'main' into grad_clip | hace 1 año | 
				
					
						|  Abhilash Majumder | 4793f0fdf3
							
							Merge branch 'main' into ipex_feature | hace 1 año | 
				
					
						|  gaopengzhi | e2797abe9b
							
							Add gradient_clipping and gradient_clipping_threshold parameters | hace 1 año | 
				
					
						|  kldarek | fc5485d916
							
							fixing wandb for fsdp | hace 1 año | 
				
					
						|  gaopengzhi | bb7c6c1e33
							
							Support FSDP scenario | hace 1 año | 
				
					
						|  kldarek | cf373529f7
							
							basic wandb logging instrumentation | hace 1 año |