当前位置: 首页 > news >正文

怎么做网站链接苏州市住建局官网

怎么做网站链接,苏州市住建局官网,宁波网站建设服务商,杭州seo技术文章目录 基本概念模型小结 基本概念 我们可以用独立学习得到的h组不同的 线性投影来变换查询、键和值。 然后#xff0c;这h组变换后的查询、键和值将并行地送到注意力汇聚中。 最后#xff0c;将这h个注意力汇聚的输出拼接在一起#xff0c; 并且通过另一个可以学习的线性… 文章目录 基本概念模型小结 基本概念 我们可以用独立学习得到的h组不同的 线性投影来变换查询、键和值。 然后这h组变换后的查询、键和值将并行地送到注意力汇聚中。 最后将这h个注意力汇聚的输出拼接在一起 并且通过另一个可以学习的线性投影进行变换 以产生最终输出。 这种设计被称为多头注意力。对于h个注意力汇聚输出每一个注意力汇聚都被称作一个头head。 模型 每个注意力头 h i h_i hi​的计算公式为 h i f ( W i ( q ) q , W i ( k ) k , W i ( v ) v ) ∈ R p v , \mathbf{h}_i f(\mathbf W_i^{(q)}\mathbf q, \mathbf W_i^{(k)}\mathbf k,\mathbf W_i^{(v)}\mathbf v) \in \mathbb R^{p_v}, hi​f(Wi(q)​q,Wi(k)​k,Wi(v)​v)∈Rpv​, 其中q-查询、k-键、v-值。 W i ( q ) W_i^(q) Wi(​q)为q通过全连接层后得到的参数、 W i ( k ) W_i^(k) Wi(​k)为k通过全连接层后得到的参数、 W i ( v ) W_i^(v) Wi(​v)为v通过全连接层后得到的参数。 f f f为注意力汇聚函数f内的注意力评分函数可以是加性注意力、缩放点击注意力。 多头注意力的输出需要经过另一个线性转换 它对应着h个头连结后的结果因此其可学习参数是 W o W_o Wo​ W o [ h 1 ⋮ h h ] ∈ R p o . \begin{split}\mathbf W_o \begin{bmatrix}\mathbf h_1\\\vdots\\\mathbf h_h\end{bmatrix} \in \mathbb{R}^{p_o}.\end{split} Wo​ ​h1​⋮hh​​ ​∈Rpo​.​ 基于这种设计每个头都可能会关注输入的不同部分 可以表示比简单加权平均值更复杂的函数。 小结 多头注意力融合了来自于多个注意力汇聚的不同知识这些知识的不同来源于相同的查询、键和值的不同的子空间表示。 基于适当的张量操作可以实现多头注意力的并行计算。
http://www.yutouwan.com/news/497370/

相关文章:

  • seo教程网站长洲网站建设
  • 免费自己制作网站教程企业制作小程序
  • 网站常用代码邢台手机网站建设
  • 诚讯通网站电商网站开发重难点
  • 高端模板网站建设公司seo网站建设优化
  • 为什么企业要建设网站口碑好网站建设是哪家
  • 电商网站建设商业计划书佛山 做网站公司
  • 有哪些中文域名网站有哪些wordpress登录没链接
  • 石家庄网站建设企业wordpress调用服务器
  • 个人网站备案如何取名称重庆营销型网站建设公司
  • 崇信县门户网站留言首页网页设计个人网页html代码
  • 郑州网站优化网络规划设计师历年考点
  • 建设银行官方网站登录入口动画制作软件ae
  • 瓷砖网站建设社区工作者有编制吗
  • 论坛网站模网站开发 在线数据库
  • 从零学建设网站如何用网站赚钱
  • 陕西网站建设的内容广东seo推广外包
  • 东莞网站建设公司招聘信息做网站前端后端ui什么意思
  • 企业网站轮播图做海报有什么素材网站知乎
  • 网站demo制作深圳建筑公司实力排名
  • 四川建设工程网上合同备案网站做个卖东西的网站
  • 简单的网站注册流程图推广app软件
  • 黄石网站设计公司网站开发用php还是.net好
  • 做网站机构wordpress 后台添加菜单
  • 求个网站你明白的 知乎合肥关键词排名
  • 做一个网站需要哪些wordpress 整理插件
  • 牡丹江做网站的公司线上免费推广平台都有哪些
  • 个人网站备注网站做用户记录
  • 大连网站设计公司智能建站服务平台
  • 广州市提取住房补贴建设银行网站陕西省医院网站建设管理