怎么用网站后台做轮播图,简约好看的ppt模板免费下载,网站开发的研究方法,绵阳 网站开发#x1f4a5;今天看一下 PyTorch数据通常的处理方法~ 一般我们会将dataset用来封装自己的数据集#xff0c;dataloader用于读取数据 Dataset格式说明
#x1f4ac;dataset定义了这个数据集的总长度#xff0c;以及会返回哪些参数#xff0c;模板#xff1a;
from tor… 今天看一下 PyTorch数据通常的处理方法~ 一般我们会将dataset用来封装自己的数据集dataloader用于读取数据 Dataset格式说明
dataset定义了这个数据集的总长度以及会返回哪些参数模板
from torch.utils.data import Datasetclass MyDataset(Dataset):def __init__(self, ):# 定义数据集包含的数据和标签def __len__(self):return len(...)def __getitem__(self, index):# 当数据集被读取时返回一个包含数据和标签的元组return self.x_data[index], self.y_data[index]
DataLoader格式说明
my_dataset DataLoader(mydataset, batch_size2, shuffleTrue,num_workers4)# num_workers:多进程读取数据
导入两个列表到Dataset
class MyDataset(Dataset):def __init__(self, ):# 定义数据集包含的数据和标签self.x_data [i for i in range(10)]self.y_data [2*i for i in range(10)]def __len__(self):return len(self.x_data)def __getitem__(self, index):# 当数据集被读取时返回一个包含数据和标签的元组return self.x_data[index], self.y_data[index]mydataset MyDataset()
my_dataset DataLoader(mydataset)for x_i ,y_i in my_dataset:print(x_i,y_i)
输出
tensor([0]) tensor([0])
tensor([1]) tensor([2])
tensor([2]) tensor([4])
tensor([3]) tensor([6])
tensor([4]) tensor([8])
tensor([5]) tensor([10])
tensor([6]) tensor([12])
tensor([7]) tensor([14])
tensor([8]) tensor([16])
tensor([9]) tensor([18])如果修改batch_size为2则输出
tensor([0, 1]) tensor([0, 2])
tensor([2, 3]) tensor([4, 6])
tensor([4, 5]) tensor([ 8, 10])
tensor([6, 7]) tensor([12, 14])
tensor([8, 9]) tensor([16, 18])
我们可以看出这是管理每次输出的批次的还可以控制用多少个线程来加速读取数据Num Workers这参数和电脑cpu核心数有关系尽量不超过电脑的核心数
导入Excel数据到Dataset中
dataset只是一个类因此数据可以从外部导入我们也可以在dataset中规定数据在返回时进行更多的操作数据在返回时也不一定是有两个。
pip install pandas
pip install openpyxlclass myDataset(Dataset):def __init__(self, data_loc):data pd.read_ecl(data_loc)self.x1,self.x2,self.x3,self.x4,self.y data[x1],data[x2],data[x3] ,data[x4],data[y]def __len__(self):return len(self.x1)def __getitem__(self, idx):return self.x1[idx],self.x2[idx],self.x3[idx],self.x4[idx],self.y[idx]mydataset myDataset(data_loce:\pythonProject Pytorch1\data.xls)
my_dataset DataLoader(mydataset,batch_size2)
for x1_i ,x2_i,x3_i,x4_i,y_i in my_dataset:print(x1_i,x2_i,x3_i,x4_i,y_i)
导入图像数据集到Dataset
需要安装opencv pip install opencv-python 加载官方数据集
有一些数据集是PyTorch自带的它被保存在TorchVision中以mnist数据集为例进行加载