Pytorch DataLoader - Выберите набор классов STL10
Можно ли тянуть только там, где class = 0 в наборе данных STL10 в PyTorch torchvision
? Я могу проверить их в цикле, но мне нужно получать партии изображений класса 0
# STL10 dataset
train_dataset = torchvision.datasets.STL10(root='./data/',
transform=transforms.Compose([
transforms.Grayscale(),
transforms.ToTensor()
]),
split='train',
download=True)
# Data loader
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
batch_size=batch_size,
shuffle=True)
for i, (images, labels) in enumerate(train_loader):
if labels[0] == 0:...
отредактируйте на основе ответа iacolippo - теперь это работает:
# Set params
batch_size = 25
label_class = 0 # only airplane images
# Return only images of certain class (eg. airplanes = class 0)
def get_same_index(target, label):
label_indices = []
for i in range(len(target)):
if target[i] == label:
label_indices.append(i)
return label_indices
# STL10 dataset
train_dataset = torchvision.datasets.STL10(root='./data/',
transform=transforms.Compose([
transforms.Grayscale(),
transforms.ToTensor()
]),
split='train',
download=True)
# Get indices of label_class
train_indices = get_same_index(train_dataset.labels, label_class)
# Data loader
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
batch_size=batch_size,
sampler=torch.utils.data.sampler.SubsetRandomSampler(train_indices))
1 ответ
Решение
Если вам нужны образцы только из одного класса, вы можете получить индексы образцов с тем же классом из Dataset
экземпляр с чем-то вроде
def get_same_index(target, label):
label_indices = []
for i in range(len(target)):
if target[i] == label:
label_indices.append(i)
return label_indices
тогда вы можете использовать SubsetRandomSampler
рисовать образцы только из списка показателей одного класса
torch.utils.data.sampler.SubsetRandomSampler(indices)