-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
作者您好,非常感谢您能够公开模型,这对我非常有帮助。
我在SEN12MS-CR数据集上面训练模型的时候,发现如果把sentinel.yaml中的batch_size直接改为2时会遇到下面的错误:
File "/mnt/workspace/users/codes/EMRDM-main/sgm/modules/diffusionmodules/sampling.py", line 465, in sampler_step x = x + ((1 - st_hat) / st_hat - (1 - st) / st) * mu + eps * append_dims(sigma_hat**2 - sigma**2, x.ndim) ** 0.5 RuntimeError: The size of tensor a (2) must match the size of tensor b (256) at non-singleton dimension 3
请问这个代码支持batch size > 1进行训练吗?我看到trainer的max_epochs是100,如果以batch size=1,在一台8卡H200上面训练,需要20天,而显存只占了10G/143G。或者是否需要训练完这100个epochs呢?
还想问一下,CUHK, CUHKv2, SEN2-MTC-new, SEN12MS-CR这四个数据集真实的训练epochs大概是多少呢?在yaml里面,他们的max_epochs分别是500, 2000, 1000, 100,是否都需要训练满这么多epochs?
非常感谢能得到您的解答!谢谢您!
Metadata
Metadata
Assignees
Labels
No labels