当前位置: 首页 > news >正文

成都 直播 网站建设门户网站 模板之家

成都 直播 网站建设,门户网站 模板之家,免费翻国外墙的浏览器,域名备案个人网站名称文章目录 5、卷积神经网络5.10、⭐批量归一化5.10.1、理论部分5.10.2、代码部分 5.11、⭐残差网络#xff08;ResNet#xff09;5.11.1、理论部分5.11.2、代码部分 话题闲谈 5、卷积神经网络 5.10、⭐批量归一化 5.10.1、理论部分 批量归一化可以解决深层网络中梯度消失和… 文章目录 5、卷积神经网络5.10、⭐批量归一化5.10.1、理论部分5.10.2、代码部分 5.11、⭐残差网络ResNet5.11.1、理论部分5.11.2、代码部分 话题闲谈 5、卷积神经网络 5.10、⭐批量归一化 5.10.1、理论部分 批量归一化可以解决深层网络中梯度消失和收敛慢的问题通过固定每个批次的均值和方差来加速收敛一般不改变模型精度。批量规范化已经被证明是一种不可或缺的方法它适用于几乎所有图像分类器。 批量规划是一个线性变换把参数的均值方差给拉的比较好。让你变化不那么剧烈。 批量规范化应用于单个可选层也可以应用到所有层其原理如下在每次训练迭代中我们首先规范化输入即通过减去其均值并除以其标准差其中两者均基于当前小批量处理。 接下来我们应用比例系数和比例偏移。 正是由于这个基于批量统计的标准化才有了批量规范化的名称。 B N ( x ) γ ⊚ x − μ ^ β B σ ^ B β BN(x) γ⊚\frac{x-\hat{μ}β_B}{\hat{σ}_B}β BN(x)γ⊚σ^B​x−μ^​βB​​β 其中x∈Bx是一个小批量B的输入比例系数γ比例偏移β。 μ ^ β B \hat{μ}β_B μ^​βB​小批量B的均值 σ ^ B \hat{σ}_B σ^B​小批量B的标准差。 μ ^ β B 1 ∣ B ∣ ∑ x ∈ B x \hat{μ}β_B \frac{1}{|B|}\sum_{x∈B}{x} μ^​βB​∣B∣1​x∈B∑​x σ ^ B 2 1 ∣ B ∣ ∑ x ∈ B ( x − μ ^ β B ) 2 c {\hat{σ}_B}^2 \frac{1}{|B|}\sum_{x∈B}{(x-\hat{μ}β_B)^2 c} σ^B​2∣B∣1​x∈B∑​(x−μ^​βB​)2c 差估计值中添加一个小的常量c0以确保永远不会尝试除以零【BN(x)分母】。通过使用平均值和方差的噪声noise估计来抵消缩放问题噪声这里是有益的。 可学习的参数比例系数γ比例偏移β 作用在全连接层和卷积层输出激活函数前 作用在全连接层和卷积层输入。 作用于全连接层的特征维 作用于卷积层的通道维 5.10.2、代码部分 直接使用深度学习框架中定义的BatchNorm定义Sequential块 import torch from torch import nn from d2l import torch as d2lnet nn.Sequential(nn.Conv2d(1, 6, kernel_size5), nn.BatchNorm2d(6), nn.Sigmoid(),nn.AvgPool2d(kernel_size2, stride2),nn.Conv2d(6, 16, kernel_size5), nn.BatchNorm2d(16), nn.Sigmoid(),nn.AvgPool2d(kernel_size2, stride2), nn.Flatten(),nn.Linear(256, 120), nn.BatchNorm1d(120), nn.Sigmoid(),nn.Linear(120, 84), nn.BatchNorm1d(84), nn.Sigmoid(),nn.Linear(84, 10))lr, num_epochs, batch_size 1.0, 10, 256 train_iter, test_iter d2l.load_data_fashion_mnist(batch_size)d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())批量规范化应用于LeNet net nn.Sequential(nn.Conv2d(1, 6, kernel_size5), BatchNorm(6, num_dims4), nn.Sigmoid(),nn.AvgPool2d(kernel_size2, stride2),nn.Conv2d(6, 16, kernel_size5), BatchNorm(16, num_dims4), nn.Sigmoid(),nn.AvgPool2d(kernel_size2, stride2), nn.Flatten(),nn.Linear(16*4*4, 120), BatchNorm(120, num_dims2), nn.Sigmoid(),nn.Linear(120, 84), BatchNorm(84, num_dims2), nn.Sigmoid(),nn.Linear(84, 10))5.11、⭐残差网络ResNet 5.11.1、理论部分 核心思想保证加更多的层效果较之前不会变差。 设计越来越深的网络网络表现不一定会更好。 实现原理-残差块residual blocks 每个附加层都应该更容易地包含原始函数作为其元素之一。 如下图 正常块中输出直接作为理想映射 f ( x ) f(x) f(x) 残差块中输出为 f ( x ) − x f(x)-x f(x)−x和 x x x两部分 x经过残差映射 f ( x ) − x f(x)-x f(x)−x输出 x作为原始数据恒等映射到输出 两者共同组成 f ( x ) f(x) f(x)。 5.11.2、代码部分 实现残差块 import torch from torch import nn from torch.nn import functional as F from d2l import torch as d2lclass Residual(nn.Module): #savedef __init__(self, input_channels, num_channels,use_1x1convFalse, strides1):super().__init__()self.conv1 nn.Conv2d(input_channels, num_channels,kernel_size3, padding1, stridestrides)self.conv2 nn.Conv2d(num_channels, num_channels,kernel_size3, padding1)if use_1x1conv:self.conv3 nn.Conv2d(input_channels, num_channels,kernel_size1, stridestrides)else:self.conv3 Noneself.bn1 nn.BatchNorm2d(num_channels)self.bn2 nn.BatchNorm2d(num_channels)def forward(self, X):Y F.relu(self.bn1(self.conv1(X)))Y self.bn2(self.conv2(Y))if self.conv3:X self.conv3(X)Y Xreturn F.relu(Y)生成两种类型的网络 验证输入输出情况一致 blk Residual(3,3) X torch.rand(4, 3, 6, 6) Y blk(X) Y.shapetorch.Size([4, 3, 6, 6])验证增加输出通道数同时减半输出的高和宽 blk Residual(3,6, use_1x1convTrue, strides2) blk(X).shapetorch.Size([4, 6, 3, 3])定义ResNet第一个Sequential块 b1 nn.Sequential(nn.Conv2d(1, 64, kernel_size7, stride2, padding3),nn.BatchNorm2d(64), nn.ReLU(),nn.MaxPool2d(kernel_size3, stride2, padding1))定义残差块 def resnet_block(input_channels, num_channels, num_residuals,first_blockFalse):blk []for i in range(num_residuals):if i 0 and not first_block:blk.append(Residual(input_channels, num_channels,use_1x1convTrue, strides2))else:blk.append(Residual(num_channels, num_channels))return blk定义其他含残差块Sequential块 每个模块使用2个残差块 b2 nn.Sequential(*resnet_block(64, 64, 2, first_blockTrue)) b3 nn.Sequential(*resnet_block(64, 128, 2)) b4 nn.Sequential(*resnet_block(128, 256, 2)) b5 nn.Sequential(*resnet_block(256, 512, 2))在ResNet中加入全局平均汇聚层以及全连接层输出 每个模块【b2-b5】有4个卷积层不包括恒等映射的1×1卷积层。 加上第一个7×7卷积层和最后一个全连接层共有18层。 因此这种模型通常被称为ResNet-18。 net nn.Sequential(b1, b2, b3, b4, b5,nn.AdaptiveAvgPool2d((1,1)),nn.Flatten(), nn.Linear(512, 10))验证每模块输出形状变化 X torch.rand(size(1, 1, 224, 224)) for layer in net:X layer(X)print(layer.__class__.__name__,output shape:\t, X.shape)Sequential output shape: torch.Size([1, 64, 56, 56]) Sequential output shape: torch.Size([1, 64, 56, 56]) Sequential output shape: torch.Size([1, 128, 28, 28]) Sequential output shape: torch.Size([1, 256, 14, 14]) Sequential output shape: torch.Size([1, 512, 7, 7]) AdaptiveAvgPool2d output shape: torch.Size([1, 512, 1, 1]) Flatten output shape: torch.Size([1, 512]) Linear output shape: torch.Size([1, 10])训练模型 lr, num_epochs, batch_size 0.05, 10, 256 train_iter, test_iter d2l.load_data_fashion_mnist(batch_size, resize96) d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())话题闲谈 怎么维护自己的电脑 对于深度学习工作者而言电脑是最为重要的工作工具之一因此维护电脑的健康状态对工作、学习和生活都至关重要。 首先定期进行系统和软件的更新保持操作系统和应用程序在最新版本以获得更好的性能和安全性。其次保持电脑的清洁定期清理灰尘和污垢确保散热良好避免过热对硬件的损害。此外备份重要数据是必不可少的以防止意外数据丢失。 在学习方面合理规划学习时间避免长时间的连续使用电脑适时休息保护眼睛和身体健康。 生活娱乐方面多参与户外活动保持身体锻炼减轻长时间坐在电脑前带来的压力。总之深度学习工作者应关注电脑的硬件和软件健康平衡工作、学习和生活保持身心健康。
http://www.yutouwan.com/news/240344/

相关文章:

  • 免费网站模板 带后台wordpress插件直播
  • 梧州网站制作基于html5的电商网站开发
  • 鞋行业的网站建设什么是电商平台推广
  • 诸葛企业网站建设公司树莓派做网站服务器怎样
  • 仿朋友圈网站建设站长统计app进入网址新版小猪
  • 潍坊高端网站开发做网站毕业设计能过吗
  • 联想粒子云可以做网站公司网站被抄袭
  • 网站模板和源码区别福州专业做网站的公司有哪些
  • 做一个官方网站需要多少钱中国新闻发布
  • 做平面有什么好的网站网站网页制作及优化
  • 网站的首页需要什么内容谷歌浏览器引擎入口
  • 在淘宝上做的网站要转出简历制作免费模板网站
  • 永久免费素材网站wordpress加入购买功能
  • 服装加盟的网站建设淘宝客优惠券网站建设教程视频
  • 查关键词热度的网站seo站长工具推广平台
  • 江津网站建设公司网站原型是什么
  • 网站关键词优化seo关键词之间最好用逗号微信小程序登陆入口
  • 做网站需要多少职务百事可乐运用了哪种网络营销方式
  • 张掖网站建设培训福建省建设执业资格注册中心网站
  • 北京网站排名方案学校网站代码
  • 网站建设的理由浏览器大全列表
  • 木马网站怎么做济南品牌网站建设价格
  • 南昌本地生活网站有哪些苏州网页制作
  • 最好好看的中文字幕seo广告投放是什么意思
  • 石家庄建站网页模板大型网站改版
  • 网站建设体质喝什么茶网络编程培训
  • asp.net网站恢复seo和sem的关系
  • vps搭建个人网站上海网站设计开发公
  • 青岛外贸网站推广自己如何建设校园网站
  • 网站建设优化建议注册公司注册地址