当前位置: 首页 > news >正文

天津网站大全电子商务网站建设运营

天津网站大全,电子商务网站建设运营,王烨萍,筑梦做网站GAN概述 在讲GAN之前#xff0c;先讲一个小趣事#xff0c;你知道GAN是怎么被发明的吗#xff1f;据Ian Goodfellow自己说#xff1a; 之前他一直在研究生成模型#xff0c;可能是一时兴起#xff0c;有一天他在酒吧喝酒时#xff0c;在酒吧里跟朋友讨论起生成模型。然…GAN概述 在讲GAN之前先讲一个小趣事你知道GAN是怎么被发明的吗据Ian Goodfellow自己说 之前他一直在研究生成模型可能是一时兴起有一天他在酒吧喝酒时在酒吧里跟朋友讨论起生成模型。然后Ian Goodfellow想到GAN的思想跟朋友说你应该这么做这么做这么做我打赌一定会有用。但是朋友不信于是他直接从酒吧回去开始做实验一晚上就写出了 GAN 论文其实灵感也是成功很重要的一部分 GAN包含有两个模型一个是生成模型generative model一个是判别模型(discriminative model)。生成模型的任务是生成看起来自然真实的、和原始数据相似的实例。判别模型的任务是判断给定的实例看起来是自然真实的还是人为伪造的真实实例来源于数据集伪造实例来源于生成模型。 这可以看做一种零和游戏。论文采用类比的手法通俗理解生成模型像“一个造假团伙试图生产和使用假币”而判别模型像“检测假币的警察”。生成器generator试图欺骗判别器discriminator判别器则努力不被生成器欺骗。模型经过交替优化训练两种模型都能得到提升但最终我们要得到的是效果提升到很高很好的生成模型造假团伙这个生成模型造假团伙所生成的产品能达到真假难分的地步。 然后GAN网络整体示意如下 人工智能基础 - 生成对抗网络GAN_人工智能 注这里的G网络的输入是一个符合简单分布如高斯分布或者均匀分布的随机噪声。 结合整体模型图示再以生成图片作为例子具体说明下面。我们有两个网络GGenerator和DDiscriminator。Generator是一个生成图片的网络它接收一个随机的噪声z通过这个噪声生成图片记做G(z)。Discriminator是一个判别网络判别一张图片是不是“真实的”。它的输入是xx代表一张图片输出Dx代表x为真实图片的概率如果为1就代表100%是真实的图片而输出为0就代表不可能是真实的图片。 相信到这里应该已经知道GAN整体上的架构了。下面说下训练 GAN模型优化训练 在训练过程中生成网络的目标就是尽量生成真实的图片去欺骗判别网络D。而网络D的目标就是尽量把网络G生成的图片和真实的图片分别开来。这样G和D构成了一个动态的“博弈过程”。这个博弈过程具体是怎么样的呢 先了解下纳什均衡纳什均衡是指博弈中这样的局面对于每个参与者来说只要其他人不改变策略他就无法改善自己的状况。对应的对于GAN情况就是生成模型 G 恢复了训练数据的分布造出了和真实数据一模一样的样本判别模型再也判别不出来结果准确率为 50%约等于乱猜。这是双方网路都得到利益最大化不再改变自己的策略也就是不再更新自己的权重。 GAN模型的目标函数如下 在这里训练网络D使得最大概率地分对训练样本的标签最大化log D(x)和 log(1−D(G(z))) 训练网络G最小化log(1 – D(G(z)))即最大化D的损失。而训练过程中固定一方更新另一个网络的参数交替迭代使得对方的错误最大化最终G 能估测出样本数据的分布也就是生成的样本更加的真实。 或者我们可以直接理解G网络的loss是log(1−D(G(z)))而D的loss是−(log(D(x))log(1−D(G(z))) 然后从式子中解释对抗我们知道G网络的训练是希望D(G(z))趋近于1也就是正类这样G的loss就会最小。而D网络的训练就是一个2分类目标是分清楚真实数据和生成数据也就是希望真实数据的D输出趋近于1而生成数据的输出即D(G(z))趋近于0或是负类。这里就是体现了对抗的思想。 然后这样对抗训练之后效果可能有几个过程原论文画出的图如下 黑色的线表示数据x的实际分布绿色的线表示数据的生成分布蓝色的线表示生成的数据对应在判别器中的分布效果 对于图aD还刚开始训练本身分类的能力还很有限有波动但是初步区分实际数据和生成数据还是可以的。图bD训练得比较好了可以很明显的区分出生成数据。然后对于图c绿色的线与黑色的线的偏移蓝色的线下降了也就是生成数据的概率下降了。那么由于绿色的线的目标是提升概率因此就会往蓝色线高的方向移动。那么随着训练的持续由于G网络的提升G也反过来影响D的分布。假设固定G网络不动训练D那么训练到最优人工智能基础 - 生成对抗网络GAN_人工智能_04。因此随着人工智能基础 - 生成对抗网络GAN_GAN_05趋近于人工智能基础 - 生成对抗网络GAN_GAN_06,人工智能基础 - 生成对抗网络GAN_GAN_07会趋近于0.5也就是到图d。而我们的目标就是希望绿色的线能够趋近于黑色的线也就是让生成的数据分布与实际分布相同。图d符合我们最终想要的训练结果。到这里G网络和D网络就处于纳什均衡状态无法再进一步更新了。 当然这里说明只是图示对于详细证明为什么最终会收敛到 人工智能基础 - 生成对抗网络GAN_GAN_08就要看原论文了 然后看下原论文的整体算法 简单理解对于辨别器如果得到的是生成图片辨别器应该输出 0如果是真实的图片应该输出 1得到误差梯度反向传播来更新参数。对于生成器首先由生成器生成一张图片然后输入给判别器判别并的到相应的误差梯度然后反向传播这些图片梯度成为组成生成器的权重。直观上来说就是辨别器不得不告诉生成器如何调整从而使它生成的图片变得更加真实。 GAN的优缺点 在基础讲完后就需要总结GAN的优缺点了以下总结都来自Ian Goodfellow的答案 G的参数更新不是直接来自数据样本,而是使用来自D的反向传播 理论上,只要是可微分函数都可以用于构建D和G,因为能够与深度神经网络结合做深度生成式模型 GANs可以比完全明显的信念网络(NADE,PixelRNN,WaveNet等)更快的产生样本,因为它不需要在采样序列生成不同的数据. 模型只用到了反向传播,而不需要马尔科夫链 相比于变分自编码器, GANs没有引入任何决定性偏置( deterministic bias),变分方法引入决定性偏置,因为他们优化对数似然的下界,而不是似然度本身,这看起来导致了VAEs生成的实例比GANs更模糊. 相比非线性ICA(NICE, Real NVE等,),GANs不要求生成器输入的潜在变量有任何特定的维度或者要求生成器是可逆的. 相比玻尔兹曼机和GSNs,GANs生成实例的过程只需要模型运行一次,而不是以马尔科夫链的形式迭代很多次. 劣势 训练GAN需要达到纳什均衡,有时候可以用梯度下降法做到,有时候做不到.我们还没有找到很好的达到纳什均衡的方法,所以训练GAN相比VAE或者PixelRNN是不稳定的,但我认为在实践中它还是比训练玻尔兹曼机稳定的多. 它很难去学习生成离散的数据,就像文本 相比玻尔兹曼机,GANs很难根据一个像素值去猜测另外一个像素值,GANs天生就是做一件事的,那就是一次产生所有像素, 你可以用BiGAN来修正这个特性,它能让你像使用玻尔兹曼机一样去使用Gibbs采样来猜测缺失值 可解释性差,生成模型的分布 Pg(G)没有显式的表达 DCGAN: DCGAN是继GAN之后比较好的改进其主要的改进主要是在网络结构上到目前为止DCGAN的网络结构还是被广泛的使用DCGAN极大的提升了GAN训练的稳定性以及生成结果质量。 DCGAN中的G网络示意相等于普通CNN的逆过程 DCGAN把上述的G和D用了两个卷积神经网络CNN。同时对卷积神经网络的结构做了一些改变以提高样本的质量和收敛的速度这些改变有 取消所有pooling层。G网络中使用转置卷积transposed convolutional layer进行上采样D网络中用加入stride的卷积代替pooling。 在D和G中均使用batch normalization 去掉FC层使网络变为全卷积网络 G网络中使用ReLU作为激活函数最后一层使用tanh D网络中使用LeakyReLU作为激活函数 WGAN和WGAN-GP WGAN也是一篇经典WGAN主要从损失函数的角度对GAN做了改进损失函数改进之后的WGAN即使在全链接层上也能得到很好的表现结果具体的来说WGAN对GAN的改进有 判别器最后一层去掉sigmoid 生成器和判别器的loss不取log 对更新后的权重强制截断到一定范围内比如[-0.010.01]以满足论文中提到的lipschitz连续性条件。 论文中也推荐使用SGD RMSprop等优化器不要基于使用动量的优化算法比如adam。 Conditional GAN 因为原始的GAN过于自由训练会很容易失去方向从而导致不稳定又效果差。而Conditional GAN就是在原来的GAN模型中加入一些先验条件使得GAN变得更加的可控制。具体的来说我们可以在生成模型G和判别模型D中同时加入条件约束y来引导数据的生成过程。条件可以是任何补充的信息如类标签其它模态的数据等。然后这样的做法应用也很多比如图像标注利用text生成图片等等。 Conditional GAN整体架构 对比之前的目标函数Conditional GAN的目标函数其实差不多 就是多了把噪声z和条件y作为输入同时送进生成器火热把数据x和条件y作为输入同时送进判别器如上整体架构图。这样在外加限制条件的情况下生成图片。
http://www.huolong8.cn/news/448012/

相关文章:

  • 网站页面设计考虑要素中国建设银行个人账户查询
  • 购物网站开发周期网站定制开发特点
  • 深圳华南城网站建设上海品牌网站建设公司排名
  • 网站制作公司教你怎么制作网站wordpress中page与post
  • 庆阳工程建设网站开发公司交房前保洁谁承担
  • 沈阳谷歌网站建设做网站有前途吗
  • 淄博市沂源县建设局网站天津网站吗
  • 天津品牌网站制作天元建设集团有限公司咋样
  • 新公司董事长致辞做网站成都犀牛网站建设公司
  • 网站开发 流程商丘网上房地产
  • 云南省建设工程标准定额网站wordpress id重置密码
  • 怎么浏览国外的设计网站jquery个人网站开发
  • 网站设计指南营销型网站建设哪家专业
  • 常用网站名称大全广告推广是什么
  • 网站开发哪一种语言好wordpress多价格插件
  • 湖州交通网站集约化建设项目网站设计网络推广
  • 福州网站建设企业哪家好?上海人才网站
  • 南平购物网站开发设计河南省工程建设信息网官网查询
  • 昆明网站建设SEO公司网校网站开发
  • wordpress主题nova网络营销就是seo
  • 学校网站代码笔趣阁建站教程
  • 广州商城网站制作网站简单的个人网站下载
  • oracle数据库网站开发网站注销备案查询
  • 龙岗网络营销网站制作哪里好安卓版傻瓜式编程app软件
  • 哪个网站做外贸比较好公司网站主页模板
  • 免费自助建站全系统做的最好的门户网站
  • 湖南专业外贸建站公司济南网站建设要多少钱
  • 公路建设查询网站长沙网络营销招聘
  • 建设网站要注意什么上海办公室装修设计公司
  • 做外贸在哪个网站小程序退款商家不给退咋办