当前位置: 首页 > news >正文

叫外包公司做网站不肯给源代码的网站开发如何找甲方

叫外包公司做网站不肯给源代码的,网站开发如何找甲方,做养生产品哪个网站好,网页制作与网站建设教程视频教程本文截取自《PyTorch 模型训练实用教程》#xff0c;获取全文pdf请点击#xff1a;https://github.com/tensor-yu/PyTorch_Tutorial [toc]我们知道一个良好的权值初始化#xff0c;可以使收敛速度加快#xff0c;甚至可以获得更好的精度。而在实际应用中#xff0c;我们通…本文截取自《PyTorch 模型训练实用教程》获取全文pdf请点击https://github.com/tensor-yu/PyTorch_Tutorial [toc]我们知道一个良好的权值初始化可以使收敛速度加快甚至可以获得更好的精度。而在实际应用中我们通常采用一个已经训练模型的模型的权值参数作为我们模型的初始化参数也称之为Finetune更宽泛的称之为迁移学习。迁移学习中的Finetune技术本质上就是让我们新构建的模型拥有一个较好的权值初始值。finetune权值初始化三步曲finetune就相当于给模型进行初始化其流程共用三步第一步保存模型拥有一个预训练模型 第二步加载模型把预训练模型中的权值取出来 第三步初始化将权值对应的“放”到新模型中一、Finetune之权值初始化在进行finetune之前我们需要拥有一个模型或者是模型参数因此需要了解如何保存模型。官方文档中介绍了两种保存模型的方法一种是保存整个模型另外一种是仅保存模型参数官方推荐用这种方法这里采用官方推荐的方法。第一步保存模型参数若拥有模型参数可跳过这一步。 假设创建了一个net Net()并且经过训练通过以下方式保存 torch.save(net.state_dict(), net_params.pkl)第二步加载模型进行三步曲中的第二步加载模型这里只是加载模型的参数 pretrained_dict torch.load(net_params.pkl)第三步初始化进行三步曲中的第三步将取到的权值对应的放到新模型中 首先我们创建新模型并且获取新模型的参数字典net_state_dict net Net() # 创建net net_state_dict net.state_dict() # 获取已创建net的state_dict接着将pretrained_dict里不属于net_state_dict的键剔除掉 pretrained_dict_1 {k: v for k, v in pretrained_dict.items() if k in net_state_dict}然后用预训练模型的参数字典 对 新模型的参数字典net_state_dict 进行更新 net_state_dict.update(pretrained_dict_1)最后将更新了参数的字典 “放”回到网络中 net.load_state_dict(net_state_dict)这样利用预训练模型参数对新模型的权值进行初始化过程就做完了。采用finetune的训练过程中有时候希望前面层的学习率低一些改变不要太大而后面的全连接层的学习率相对大一些。这时就需要对不同的层设置不同的学习率下面就介绍如何为不同层配置不同的学习率。二、不同层设置不同的学习率在利用pre-trained model的参数做初始化之后我们可能想让fc层更新相对快一些而希望前面的权值更新小一些这就可以通过为不同的层设置不同的学习率来达到此目的。为不同层设置不同的学习率主要通过优化器对多个参数组进行设置不同的参数。所以只需要将原始的参数组划分成两个甚至更多的参数组然后分别进行设置学习率。 这里将原始参数“切分”成fc3层参数和其余参数为fc3层设置更大的学习率。请看代码ignored_params list(map(id, net.fc3.parameters())) # 返回的是parameters的 内存地址 base_params filter(lambda p: id(p) not in ignored_params, net.parameters()) optimizer optim.SGD([ {params: base_params}, {params: net.fc3.parameters(), lr: 0.001*10}], 0.001, momentum0.9, weight_decay1e-4)第一行 第二行的意思就是将fc3层的参数net.fc3.parameters()从原始参数net.parameters()中剥离出来 base_params就是剥离了fc3层的参数的其余参数然后在优化器中为fc3层的参数单独设定学习率。optimizer optim.SGD(......)这里的意思就是 base_params中的层用 0.001, momentum0.9, weight_decay1e-4 fc3层设定学习率为 0.001*10 完整代码位于 https://github.com/tensor-yu/PyTorch_Tutorial/blob/master/Code/2_model/2_finetune.py 补充挑选出特定的层的机制是利用内存地址作为过滤条件将需要单独设定的那部分参数从总的参数中剔除。 base_params 是一个list每个元素是一个Parameter 类 net.fc3.parameters() 是一个 ignored_params list(map(id, net.fc3.parameters())) net.fc3.parameters() 是一个 所以迭代的返回其中的parameter这里有weight 和 bias 最终返回weight和bias所在内存的地址转载请注明出处https://blog.csdn.net/u011995719/article/details/85107310
http://www.huolong8.cn/news/396991/

相关文章:

  • 做网站必要性移动端购物网站建设
  • 杭州五旋科技网站建设怎么样哈尔滨网站建设方案
  • 做问卷调查赚钱的网站好导入视频生成3d动画
  • 商城网站建设报价表潜江建设局网站
  • 成都网站建设推广在寓意好的装饰公司名称
  • 国外设计网站导航网络营销推广的步骤
  • 手机版网站推荐nas服务器 做网站
  • 关于加强公司 网站建设的通知设计师做网站效果图
  • 设计师必去的网站做网站的基本要素
  • 购物网站开发设计做网站维护前景
  • 汕头市研发网站建设分类信息的网站排名怎么做
  • 网站开发毕设参考文献广州电商设计公司
  • 社区网站怎么做做海报素材的网站
  • 凡科企业邮箱登录入口网站关键词排名优化电话
  • 自己做的视频网站上传电影html5网页制作课程
  • 网站建设教程模板wordpress压缩包
  • 郑州美容网站建设常平网站建设
  • 上国外网站 dns推广怎么做
  • 具有价值的网站建设宠物社区网站开发设计文档
  • wordpress 编写页面网站优化 方案
  • iis 网站打不开提供专业网站建设平台
  • 做购物网站的业务做网站人才
  • 网站宣传方法有哪些云南公共资源交易中心
  • discuz 仿h5 网站模板安卓项目开发
  • 我和椅子做游戏小精灵网站wordpress设置静态访问不了
  • 中原彼得堡航空学院网站的建设福州设计企业项目建设管理系统
  • 广州广告网站建设学校网站开发
  • 二级域名做非法网站wordpress ldap
  • 晚上奖励自己的网站推荐甘肃兴城建设有限公司网站
  • 河北商城网站建设价格wordpress 淘宝客 百度云