Potential Issue on data loader in distributed setting.

Hello, 
It seems that the dataloader is not adapted to distributed setting (Line 881 at train.py).
The data entries will be repeatedly loaded and trained by different processes.
Maybe a sampler should be added, code as below:
```python
train_dataloader = torch.utils.data.DataLoader(
        train_dataset,
        shuffle=(args.split=='train'),
        collate_fn=collate_fn,
        batch_size=args.train_batch_size,
        num_workers=args.dataloader_num_workers,
        drop_last=True, 
        sampler=torch.utils.data.distributed.DistributedSampler(train_dataset), 
    )
```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Potential Issue on data loader in distributed setting. #15

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Potential Issue on data loader in distributed setting. #15

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions