当前位置: 首页 > news >正文

织梦五彩婚纱源码网_婚庆策划网站php源码怎么做同学录的网站

织梦五彩婚纱源码网_婚庆策划网站php源码,怎么做同学录的网站,四川建设厅,个人备案 网站名称 例子来源#xff1a;数学中国图神经网络#xff08;GNN#xff09;是机器学习中最热门的领域之一#xff0c;在过去短短数月内就有多篇优秀的综述论文。但数据科学家 Matt Ranger 对 GNN 却并不感冒。他认为这方面的研究会取得进展#xff0c;但其他研究方向或许更重要。博客链… 来源数学中国图神经网络GNN是机器学习中最热门的领域之一在过去短短数月内就有多篇优秀的综述论文。但数据科学家 Matt Ranger 对 GNN 却并不感冒。他认为这方面的研究会取得进展但其他研究方向或许更重要。博客链接https://www.singlelunch.com/2020/12/28/why-im-lukewarm-on-graph-neural-networks/机器之心对这篇博客进行了编译整理以下是博客内容。模型的关键是压缩图经常被认为是一种「非欧几里得」数据类型但实际上并不是。正则图regular graph只是研究邻接矩阵的另一种方式如上图所示充满实数的矩阵却被称为「非欧几里得」这很奇怪。其实这是出于实际原因。大多数图都相当稀疏因此矩阵中会包含很多 0。从这个角度看非零数值非常重要这让问题接近于计算上很难的离散数学而不是容易的连续、梯度友好的数学。有了全矩阵情况会变得容易如果不考虑物理领域的内容并假设存在全邻接矩阵那么很多问题就会迎刃而解。首先网络节点嵌入不再是问题。一个节点就是矩阵中的一行因此它本身已经是数字向量。其次所有网络预测问题也都被解决。一个足够强大且经过良好调整的模型将只提取网络与附加到节点上的目标变量之间的全部信息。NLP 也只是一种花哨的矩阵压缩让我们把目光从图转移到自然语言处理NLP领域。大多数 NLP 问题都可以看成图问题所以这并不是题外话。首先像 Word2Vec、GloVe 这类经典词嵌入模型只进行了矩阵分解。GloVe 算法基于词袋bag of words矩阵的一种变体运行。它会遍历句子并创建一个隐式共现图图的节点是词边的权重取决于这些单词在句子中一同出现的频率。之后Glove 对共现图的矩阵表示进行矩阵分解Word2Vec 在数学方面是等效的。语言模型也只是矩阵压缩NLP 中许多 SOTA 方法都离不开语言模型。以 BERT 为例BERT 基于语境来预测单词这就使我们正在分解的矩阵从词对共现发展为基于句子语境的共现我们正在培养待分解的「理想矩阵」。正如 Hanh Futrell 所说人类语言和语言建模具有无限的统计复杂度但可以在较低层次上得到很好地近似。这一观察结果有两层含义我们可以使用相对较小的模型获得不错的结果扩大模型具备很大潜力。语言模型解决了很大的问题空间以至于从柯氏复杂性Kolmogorov Complexity角度来看它们可能近似压缩了整个语言。庞大的语言模型可能记住了很多信息而不是压缩信息。我们能像语言模型一样对任意图执行上采样吗实际上我们已经在做了。我们将图的「一阶」嵌入称为通过直接分解图的邻接矩阵或拉普拉斯矩阵Laplacian matrix来运行的方法。只要使用拉普拉斯特征映射Laplacian Eigenmap或采用拉普拉斯的主要组成部分进行图嵌入那它就是一阶方法。类似地GloVe 是词共现图上的一阶方法。我最喜欢的图一阶方法之一是 ProNE它和大多数方法一样有效但速度快了一个数量级。高阶方法嵌入了原始矩阵和邻居的邻居连接第二阶以及更深的 k 步连接。GraRep 表明通过扩展图矩阵可以基于一阶方法生成高阶表示。高阶方法是在图上执行的上采样。基于大型邻域采样的 GNN 和 node2vec 等随机游走方法执行的是高阶嵌入。性能增益在哪儿过去 5 年中大多数 GNN 论文的实验数据对从业者选择要使用的模型都是无用的。正如论文《Open Graph Benchmark: Datasets for Machine Learning on Graphs》中所写的那样许多 GNN 论文基于一些节点数为 2000-20,000 的小型图数据集进行实验如 Cora、CiteSeer、PubMed。这些数据集无法真正地区分不同 GNN 方法之间的区别。近期的一些研究开始直接解决这一问题但是为什么研究者这么长时间一直在小型、无用的数据集上做实验呢这个问题值得讨论。性能和任务有关一个令人震惊的事实是尽管语言模型在大量 NLP 任务中达到最优性能但如果你只是把句子嵌入用于下游模型那么从语言模型嵌入中获得的性能增益并不比累加 Word2Vec 词嵌入这类简单方法要多。类似地我发现对于很多图而言简单的一阶方法在图聚类和节点标签预测任务中的性能和高阶嵌入方法差不多。事实上高阶方法还消耗了大量算力造成了浪费。此类一阶方法包括 ProNE 和 GGVec一阶。高阶方法通常在链接预测任务上有更好的表现。有趣的是链接预测任务中的性能差距对于人工创建的图而言是不存在的。这表明高阶方法的确能够学习到现实图的某种内在结构。就可视化而言一阶方法表现更好。高阶方法的可视化图可能会出现伪影例如 Node2Vec 可视化会有长丝状的结构它们来自较长单链随机游走的嵌入。高阶方法和一阶方法的可视化对比情况参见下图最后有时候简单的方法能够打败高阶方法。问题在于我们不知道什么时候一类方法优于另一类方法当然也不知道其原因。不同类型的图在被不同方法表示时反应有好有坏这背后当然是有原因的。但这目前仍是个开放性问题。这其中的一大因素是研究空间充斥了无用的新算法。原因如下学术动机阻碍进步愤世嫉俗者认为机器学习论文是通过以下方式炮制的使用已有的算法添加新的层 / 超参数用数学形式描述其重要性对超参数执行网格搜索直到该新方法打败被模仿的那个基线方法绝不对在「实验结果」部分中进行对比的方法执行网格搜索给新方法起个不错的缩写名称不公布 Python 2 代码。我不是唯一一个对当前可复现研究持此观点的人。至少近两年情况好了一点。所有进展都关乎实际问题早在四十多年前我们就已经知道如何训练神经网络了但直到 2012 年 AlexNet 出现神经网络才出现爆炸式发展。原因在于实现和硬件都发展到了一个节点足以使深度学习应用于实际问题。类似地至少 20 年前我们就已经知道如何将词共现矩阵转换为词嵌入。但词嵌入技术直到 2013 年 Word2Vec 问世才出现爆发式发展。其突破点在于基于 minibatch 的方法允许在商用硬件上训练 Wikipedia 规模的嵌入模型。如果只花费数天或数周时间在小规模数据上训练模型那么这个领域的方法很难取得进步。研究者会失去探索新方法的动力。如果你想取得进展你必须尝试在商用硬件上以合理时间运行模型。谷歌的初始搜索算法最开始也是在商用硬件上运行的。效率更重要深度学习研究的爆发式发展离不开效率的提升以及更好的软件库和硬件支持。模型架构没那么重要今年更加重要的一篇论文是 OpenAI 的《Scaling Laws for Neural Language Models》。这篇文章指出模型中的原始参数数量是对整体性能最具预测性的特征。最初的 BERT 论文也指出了这一点并推动了 2020 年大规模语言模型的迅速增加。这一现实呼应了 Rich Sutton 在《苦涩的教训 (https://mp.weixin.qq.com/s/B6rnFLxYe2xe5C5f2fDnmw)》一文中提出的观点利用算力的一般方法最终是最有效的方法。Transformer 可能也在替代卷积正如知名 YouTube 博主 Yannic Kilcher 所说Transformer 正在毁掉一切。它们可以和图网络结合这也是最近几年出现的方法之一而且在基准测试中表现出色。研究者似乎在架构方面投入了太多精力但架构并没有那么重要因为你可以通过堆叠更多层来近似任何东西。效率的胜利是伟大的而神经网络架构只是实现这一目标的方式之一。在架构方面投入过多的精力只会使我们错过其他方面的巨大收益。当前的图数据结构实现太差劲了NetworkX 是一个糟糕的库。我是说如果你正在处理一些微小的图该库表现还 OK。但如果处理大规模的图任务这个库会令你抓狂且迫使你重写所有的东西。这时多数处理大规模图任务的用户不得不手动滚动一些数据结构。这很难因为你的计算机内存是由 1 和 0 组成的一维数组并且图没有明显的一维映射。这种情况在我们更新图如添加 / 移除节点 / 边缘时会变得更加困难。以下提供了几个替代选择分离的指针网络NetworkX 就是最好的示例。每个节点对象都包含指向其他节点的指针列表节点边缘其布局就像链表一样。链表完全违背了现代计算机的设计方式。它从内存中读取数据非常慢但在内存中的运行速度却很快快了两个数量级。在这种布局中无论何时做任何事情你都需要往返 RAM。这在设计上就很慢你可以使用 Ruby、C 或者汇编语言编写但还是很慢这是因为硬件上的内存读取速度就很慢。这种布局的主要优势在于其添加了新节点 O(1)。所以如果你在维护一个庞大的图并且添加和移除节点的频率与从图中读取数据的频率相同则这种布局挺适合的。另外一个优势是这种布局可以「扩展」。这是因为所有数据彼此之间可解耦所以你可以将这种数据结构放置在集群上。但实际上你正在为自身问题创造一个复杂的解决方案。稀疏邻接矩阵稀疏邻接矩阵非常适合只读read-only图。我在自己的 nodevectors 库中将它作为后端使用很多其他的库编写者使用 Scipy CSR Matrix。最流行的布局是 CSR 格式你可以使用 3 个数组来保存图分别用于边缘终点、边缘权重和「索引指针」该指针说明边缘来自哪个节点。此外得益于 CSR 的 3 数组布局它可以在单个计算机上进行扩展CSR 矩阵可以放置在磁盘上而不用放在内存中。你只需要对 3 个数组执行内存映射并在磁盘上使用它们。随着现代 NVMe 驱动器的出现随机搜索速度不再那么慢了要比扩展基于链表的图时进行分布式网络调用快得多。但这种表征存在的问题是添加一个节点或边缘意味着重建整个数据结构。Edgelist 表征这种表征具有 3 个数组分别用于边缘源、边缘终点和边缘权重。DGL 包在其内部使用的正是这种表征。其简单、紧凑的布局非常适合分析使用。与 CSR 图相比该表征的问题在于某些寻轨操作seek operation速度较慢。假设你要找出节点4243 的所有边缘则如果不维护索引指针数组就无法跳转到那里。因此你可以保持 sorted order 和二分搜索 (O(log2n)) 或 unsorted order 和线性搜索 (O(n))。这种数据结构也可以在内存映射的磁盘阵列上使用并且在 unsorted 版本上节点添加速度很快在 sorted 版本上运行缓慢。全局方法是条死胡同一次性处理整个图的方法无法利用算力因为它们达到一定规模就会把 RAM 耗尽。因此任何想要成为新标准的方法都要能对图的各个部分进行逐个更新。基于采样的方法未来采样效率将变得更加重要。Edgewise 局部方法。我所知道的能做到这一点的算法只有 GloVe 和 GGVec它们通过一个边列表并在每一步上更新嵌入权重。这种方法的问题在于它们很难应用于更加高阶的方法。但其优点也很明显很容易进行扩展即使是在一台计算机上也不例外。此外逐渐增加新的节点也很简单只需要获取现有的嵌入添加一个新节点然后在数据上执行一个新的 epoch。随机游走采样。采用这一方法的包括 deepwalk 及相关的后续工作通常用于嵌入而不是 GNN 方法。这在计算上可能非常昂贵添加新节点也很困难。但它是可以扩展的Instagram 就用它来为自己的推荐系统提供信息。邻接采样。这是目前 GNN 中最普遍的一种采样方法低阶、高阶都适用取决于 neighborhood 的大小。它的可扩展性也很好尽管很难高效执行。Pinterest 的推荐算法用的就是这种方法。结论这里有几个有趣的问题图类型和图方法之间是什么关系统一的基准测试如 OGB。我们把随机的模型扔给随机的基准却不知道为什么或者什么时候它们表现得更好。更基础的研究。我很好奇其他表示类型如 Poincarre 嵌入能否有效地编码定向关系另一方面我们不应该再专注于添加新的层并在相同的小型数据集上进行测试。没人在乎这个。这篇博客在 Reddit 上引发了一些讨论详情参阅https://www.reddit.com/r/MachineLearning/comments/kqazpd/d_why_im_lukewarm_on_graph_neural_networks/未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。  如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
http://www.yutouwan.com/news/403719/

相关文章:

  • 公司网站开发费用济南兴田德润o评价网站设计与开发公司
  • 视网站亏损了为什么还做wordpress fatal error
  • 上海建设工程监督总站网站c#做的网站怎么上传
  • 网站推广站点建设与策划设计公司logo免费
  • 保养车哪个网站做的好软件开发文档范例
  • 公司网站要使用我个人的信息备案免费的网页入口
  • vue做网站好吗深圳软件开发培训
  • 余干县建设局网站wordpress4.6 手册
  • 哪里查询网站备案seo技术培训岳阳
  • 如何在网站上做自动弹出潍坊哪里有做360网站的
  • 怎么给网站创建二维码拼多多关键词排名查询工具
  • 专业 网站设计公司价格惠州网络推广公司哪家好
  • 网站开发实战asp制作视频成都移动网站建设
  • 最低的成本做网站可视化网页编辑工具
  • 企业网站seo案例分析建设厅的证全国通用吗
  • 大型门户网站开发方案新建设电影院 网站
  • 网站服务器地址查询合肥关键词排名
  • 哪个网站上做ppt比较好看的图片网站建设评估
  • wordpress有哪些网站有没有网站免费的
  • 济南网站建设公司大全wordpress 浏览ppt
  • 中企动力做网站价格注册建设网站的公司
  • 深圳网站设计我选刻企业计划书怎么写
  • 佛山市网站建设公司什么是营销型手机网站建设
  • 网站建设的原理天津塘沽爆炸地点
  • 自己做书画交易网站找网站建设需要问什么软件
  • 排版设计模板网站网站建设第二年费用
  • 网站搭建好后被移动宽带屏蔽怎么办莱州市双语网站
  • 网站建设新闻咨询wordpress 收费版
  • 网站 快照 更新慢软件开发培训哪里好
  • 二维码怎么做网站江苏公司网站建设