当前位置: 首页 > news >正文

温州网站制作计划wordpress电话

温州网站制作计划,wordpress电话,百度搜索引擎营销,室内设计公司加盟一、单进程读取数据 Dataset 在数据量很大#xff0c;无法将全部数据加载到内存的情况下#xff0c;可以在init中读出表数据行数#xff0c;在__len__设置为长度返回#xff0c;在__getitem__中根据idx读表#xff0c;idx就可以表示读取的表的行数#xff0c;一般在读表…一、单进程读取数据 Dataset 在数据量很大无法将全部数据加载到内存的情况下可以在init中读出表数据行数在__len__设置为长度返回在__getitem__中根据idx读表idx就可以表示读取的表的行数一般在读表的时候写作 path/table_name?start{}end{} import torch import numpy as np from torch.utils.data import IterableDataset, Dataset 需要先一次性把data都从文件或者表中读出来知道数据的长度为了生成index列表长度为数据的长度 分batch训练的时候dataloader根据分好的一个batch中的idx来读取这个batch中的数据 a [{anchor_text: np.array([1, 1, 1]), anchor_vis: np.array([1, 1, 1])},{anchor_text: np.array([2, 2, 1]), anchor_vis: np.array([4, 1, 1])},{anchor_text: np.array([3, 3, 1]), anchor_vis: np.array([2, 1, 1])},{anchor_text: np.array([4, 4, 1]), anchor_vis: np.array([3, 1, 1])}]class TableDataset(Dataset):def __init__(self):self.tablepath self.data_length len(a)def __len__(self):return self.data_lengthdef __getitem__(self, idx):return a[idx]train_dataset TableDataset() train_ld torch.utils.data.DataLoader(train_dataset, batch_size2, shuffleFalse)for idx, batch_data in enumerate(train_ld):print(batch_data)at batch_data[anchor_text].to(torch.float32)# print(at--------,at)IterableDataset 在数据量很大无法将全部数据加载到内存的情况下可以在__iter__中一行一行的读表读一行就立马返回一行。 import torch import numpy as np from torch.utils.data import IterableDataset, Dataset不需要一次性知道数据长度 分batch训练的时候dataloader根据一个batch的大小bs来执行__iter__函数bs次得到这个batch的数据 a [{anchor_text: np.array([1, 1, 1]), anchor_vis: np.array([1, 1, 1])},{anchor_text: np.array([2, 2, 1]), anchor_vis: np.array([4, 1, 1])},{anchor_text: np.array([3, 3, 1]), anchor_vis: np.array([2, 1, 1])},{anchor_text: np.array([4, 4, 1]), anchor_vis: np.array([3, 1, 1])}]class TableDataset2(IterableDataset):def __init__(self):self.tablepath def __iter__(self):for line in a:print(line:,line)yield linetrain_dataset TableDataset2() train_ld torch.utils.data.DataLoader(train_dataset, batch_size2, shuffleFalse)for idx, batch_data in enumerate(train_ld):print(batch_data)at batch_data[anchor_text].to(torch.float32)# print(at--------,at)上述提到的处理数据量大的方法都需要提前将数据处理好存入表中程序读取数据就可以直接跑模型了。 二、多进程读取数据 后续有时间再补上 IterableDataset 当DataLoader设置为多进程时每个进程都会拥有一个IterableDataset的生成器函数__iter__每当这个进程收集到的数据达到batch size的时候就把这批收集到的数据给loader也就在for batch_data in train_loader: 的时候就能得到这批数据。
http://www.huolong8.cn/news/257484/

相关文章:

  • 软件网站开发公司商品关键词举例
  • c2c网站管理系统ic千库网
  • 手机有软件做ppt下载网站怎样创建网站发招聘信息
  • 山东省级建设主管部门网站教做网站视频
  • 网站申请qq百度指数批量获取
  • 广西建设监理协会官网站网站建设合作流程
  • 海珠定制型网站建设可以做围棋题的网站
  • 扬州做网站的网络公司和网站开发公司如何签合同
  • 建设医院网站ppt模板网站用户体验解决方案
  • 网站用哪个做wordpress的注册文件在哪
  • 网站建设收费项目阿里云快速建站教程
  • 金融行业seo整站优化网页图片另存为的时候保存不了jpg
  • html5网站建设中模板如何自己制造软件
  • 2018做网站开发一个月工资多少沈阳化工大学建设工程网
  • 中山 在门户网站推广html的网站模板下载
  • 重庆网站建设公司有哪些重庆专业网站定制
  • 旅行社服务网点能否做网站安卓应用市场app下载安装
  • 北京网站制作很好 乐云践新网络营销专家
  • 西昌规划和建设局网站知名高端网站建设报价
  • 常宁网站设计石岩附近网站建设公司
  • 营销型网站要点网站开发小组分工
  • 怎么在百度自己创网站模拟网站开发
  • 漫画做视频在线观看网站有经验的南昌网站建设
  • 新农村网站建设小白如何自己做网站
  • 宝山顺德网站建设装修平台网站排名前十名有哪些
  • 免费网站软件下载大全动漫福州网站设计
  • 乐清联科网站建设天津魔方网站建设
  • 郑州公司网站制作网站开发维护关键技术
  • 婚纱网站建设案例2021深圳装修公司排名前十强
  • 网站 永久关停 请示wordpress 模板 删除