kreshuklab · KRiedmiller · Jun 19, 2026 · Jun 16, 2026 · Jun 18, 2026
diff --git a/panseg/functionals/prediction/utils/size_finder.py b/panseg/functionals/prediction/utils/size_finder.py
@@ -209,7 +209,7 @@ def find_batch_size(
     model = model.to(device)
     model.eval()
     with torch.no_grad():
-        for batch_size in [1, 2, 4, 8, 16, 32, 64, 128]:
+        for batch_size in [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024]:
             x = None
             try:
                 x = torch.randn((batch_size, in_channels) + actual_patch_shape).to(

diff --git a/panseg/functionals/training/biio.py b/panseg/functionals/training/biio.py
@@ -33,6 +33,7 @@ def make_model_description(
     feature_maps: int | list[int] | tuple[int, ...],
     patch_size: tuple[int, int, int],
     dimensionality: Literal["2D", "3D"],
+    layer_order: str,
     modality: str,
     output_type: str,
     description: str,
@@ -165,6 +166,7 @@ def make_model_description(
             "in_channels": in_channels,
             "out_channels": out_channels,
             "f_maps": feature_maps,
+            "layer_order": layer_order,
         },
     )
 

diff --git a/panseg/functionals/training/train.py b/panseg/functionals/training/train.py
@@ -17,6 +17,7 @@
     PATH_TRAIN_TEMPLATE,
 )
 from panseg.core.zoo import model_zoo
+from panseg.functionals.prediction.utils.size_finder import find_batch_size
 from panseg.functionals.training.augs import Augmenter
 from panseg.functionals.training.biio import make_model_description
 from panseg.functionals.training.h5dataset import HDF5Dataset
@@ -33,6 +34,7 @@ def create_model_config(
     out_channels,
     patch_size,
     dimensionality: Literal["2D", "3D"],
+    layer_order: str,
     sparse,
     f_maps,
     max_num_iters,
@@ -46,6 +48,7 @@ def create_model_config(
 
     train_template["model"]["in_channels"] = in_channels
     train_template["model"]["out_channels"] = out_channels
+    train_template["model"]["layer_order"] = layer_order
     train_template["model"]["f_maps"] = f_maps
     if dimensionality in ["2D", "2d", "2"]:
         train_template["model"]["name"] = "UNet2D"
@@ -87,6 +90,7 @@ def unet_training(
     description: str = "",
     resolution: tuple[float, float, float] = (1.0, 1.0, 1.0),
     pre_trained: Optional[Path] = None,
+    layer_order: str = "bcr",
 ) -> None:
     """
     Main entrypoint for training a new unet model. Gets called when calling `panseg --train` from cli.
@@ -99,20 +103,29 @@ def unet_training(
             out_channels=out_channels,
             f_maps=feature_maps,
             final_sigmoid=final_sigmoid,
+            layer_order=layer_order,
         )
     elif dimensionality in ["3D", "3d", "3"]:
         model = UNet3D(
             in_channels=in_channels,
             out_channels=out_channels,
             f_maps=feature_maps,
             final_sigmoid=final_sigmoid,
+            layer_order=layer_order,
         )
     else:
         raise ValueError(f"Unknown dimensionality {dimensionality}")
     logger.info(f"Using {model.__class__.__name__} model for training.")
 
     # Device configuration
-    batch_size = 1
+    batch_size = find_batch_size(
+        model=model,
+        in_channels=in_channels,
+        patch_shape=patch_size,
+        patch_halo=(4, 4, 4),  # some slack
+        device=device,
+    )
+
     if torch.cuda.device_count() > 1 and device != "cpu":
         model = nn.DataParallel(model)
         logger.info(f"Using {torch.cuda.device_count()} GPUs for prediction.")
@@ -132,7 +145,7 @@ def unet_training(
             batch_size=batch_size,
             shuffle=True,
             pin_memory=True,
-            num_workers=1,
+            num_workers=4,
         )
     }
     if len(val_datasets) > 0:
@@ -141,7 +154,7 @@ def unet_training(
             batch_size=batch_size,
             shuffle=False,
             pin_memory=True,
-            num_workers=1,
+            num_workers=4,
         )
     else:
         loaders["val"] = []
@@ -160,6 +173,7 @@ def unet_training(
         out_channels,
         patch_size,
         dimensionality,
+        layer_order,
         sparse,
         feature_maps,
         max_num_iters,
@@ -219,6 +233,7 @@ def unet_training(
             feature_maps=feature_maps,
             patch_size=patch_size,
             dimensionality=dimensionality,
+            layer_order=layer_order,
             modality=modality,
             output_type=output_type,
             description=description,

diff --git a/tests/functionals/training/test_biio.py b/tests/functionals/training/test_biio.py
@@ -30,6 +30,7 @@ def test_make_model_description(tmp_path):
             feature_maps=64,
             patch_size=(16, 32, 64),
             dimensionality="3D",
+            layer_order="bcr",
             modality="mod",
             output_type="boundaries",
             description="dummy model",

diff --git a/tests/functionals/training/test_training.py b/tests/functionals/training/test_training.py
@@ -79,6 +79,7 @@ def test_create_model_config_2d(self):
                 out_channels=2,
                 patch_size=[64, 64],
                 dimensionality="2D",
+                layer_order="bcr",
                 sparse=False,
                 f_maps=[16, 32, 64],
                 max_num_iters=1000,
@@ -114,6 +115,7 @@ def test_create_model_config_3d(self):
                 out_channels=3,
                 patch_size=[32, 64, 64],
                 dimensionality="3D",
+                layer_order="bcr",
                 sparse=True,
                 f_maps=[8, 16, 32],
                 max_num_iters=2000,
@@ -494,8 +496,10 @@ def test_unet_training_with_existing_checkpoint_dir(
     @patch("torch.nn.DataParallel")
     @patch("panseg.functionals.training.train.Adam")
     @patch("panseg.functionals.training.train.ReduceLROnPlateau")
+    @patch("panseg.functionals.training.train.find_batch_size")
     def test_unet_training_multi_gpu(
         self,
+        mock_find_batch_size,
         mock_reduce_lr,
         mock_adam,
         mock_data_parallel,
@@ -541,6 +545,8 @@ def test_unet_training_multi_gpu(
 
         mock_isinstance.return_value = False
 
+        mock_find_batch_size.return_value = 1
+
         # Create a temporary dataset directory
         dataset_dir = tmp_path / "dataset"
         dataset_dir.mkdir()

diff --git a/tests/functionals/training/test_training_integration.py b/tests/functionals/training/test_training_integration.py
@@ -110,7 +110,7 @@ def test_training_integration_3d_gpu(self, mocker, tmp_path):
             model_name=model_name,
             in_channels=1,
             out_channels=1,
-            feature_maps=16,
+            feature_maps=[16, 32, 64],
             patch_size=(16, 64, 64),
             max_num_iters=100,
             dimensionality="3D",