当前位置: 首页 > news >正文

《美食天下》网站的建设江西省赣州市有什么好玩的地方

《美食天下》网站的建设,江西省赣州市有什么好玩的地方,wordpress设计博客都澜,360建筑网在哪里简介#xff1a;归因的方法有多种#xff0c;这篇文章的重点是指标拆解#xff0c;也是我们做业务分析时最常用到的方法。我们的目的是解放人力#xff0c;将指标拆解实现自动化#xff0c;一方面可以加快业务迭代速度#xff0c;快速定位问题#xff1b;另一方面可以对…简介归因的方法有多种这篇文章的重点是指标拆解也是我们做业务分析时最常用到的方法。我们的目的是解放人力将指标拆解实现自动化一方面可以加快业务迭代速度快速定位问题另一方面可以对可能产生异动的维度进行全局量化增强可比性明确下一步的业务行动点的优先级。自动化异变归因的目的是为了尽快判断并抓住机遇寻求以数据驱动作为灯塔指引业务航向。 作者 | 伊琏 来源 | 阿里技术公众号 一 前言 唯一不变的是变化在拥抱它前请事先探知、归因、并充分准备。 在相对完善的指标体系建设背景下我们需要通过指标以及指标波动的解读来描述、追踪、推动业务。当一个指标波动时我们首先需要从业务视角判断其波动是否异常即异动检测其次判断异常背后的原因是什么即异动归因。 归因的方法有多种这篇文章的重点是指标拆解也是我们做业务分析时最常用到的方法。我们的目的是解放人力将指标拆解实现自动化一方面可以加快业务迭代速度快速定位问题另一方面可以对可能产生异动的维度进行全局量化增强可比性明确下一步的业务行动点的优先级。自动化异变归因的目的是为了尽快判断并抓住机遇寻求以数据驱动作为灯塔指引业务航向。 二 目的 三 贡献率的拆解方法 1 加法拆解 举例针对绝对值指标的维度拆解都是加法拆解。绝对量指标的同比/环比变化就是各个分指标变化的加权求和例如访问uv总和等于各渠道uv加总 那么总uv的变化下钻贡献率等于各渠道分别的变化除以上个月的总uv数。 2 乘法拆解 举例 漏斗模型借助用户动线拆解指标。 以全站商品详情页的浏览量ipv为例其变动涉及流量、承接页到商品详情页的转化uv-d转化、商品详情页用户人均浏览量人均pv分别对应了用户增长、搜推场景承接以及私域用户活跃度等业务域或用户行为指标。借此对全站ipv的构成链路进行静态乘法拆解 3 比率型指标拆解 4 实例应用 根据上文提到的不同指标的计算方法支持全类型指标下钻求贡献的场景 可根据先验业务输入搭建多层的归因逻辑模型 层层下钻最终将指标波动定位。 图二计算贡献率之后的数据结果样式 以2011年某日ipv同比下跌的异动分析为例 第一层拆解借助用户动线将存在异动变化的指标ipv构成链路进行乘法拆解如下 这里帮助我们定位到可能导致指标异动的关键节点这有助于我们将问题定位到具体业务域例如是uv的问题转化的问题还是人均ipv的问题 第二层拆解对关键节点处的多个维度进行下钻将问题定位到某些维度的某些水平上同时避免陷入辛普森悖论等陷阱这有助于我们形成具体业务域有所行动 例如如果是转化的问题究竟是哪个渠道的转化减少了 下图“异动分析拆解流程图”是根据先验的业务输入搭建的归因模型根据其框架得以进行贡献率拆解与问题定位 图三指标拆解逐层归因 红色表示的链路指标或维度代表对总值下跌贡献率较大经过一层一层的拆解定位到app端自然流量中转化的降低导致总转化下降。 基于流量跨端调控以及流量预算减投的业务背景我们现将对ipv贡献最大的uv/duv根据端型、流量渠道类型、流量渠道、国家四个维度进行贡献率拆解。 在本实例中通过本文对贡献率拆解方法与业务人工看数得到的问题定位基本一致该方法可以实现异动贡献率量化与提效的目的具体核心结论如下 结论一 第一层拆解ipv下降主要影响因素是uv-d转化率的波动。 结论二 第二层拆解uv-d比率的波动主要由APP端与WAP端导致两种端型贡献持平。 结论三 第三/四层拆解APP端的自然流量和wap端的付费流量是uv-d总比率波动的主要贡献维度。 结论四 第五层拆解APP端self-visit中美国对uv-d比率的波动贡献较大。 通过建立多层归因下钻维度模型 用自动化的方式层层剥析从而能尽求完善且正确的归因到某个维度从而节省人力提高准确和科学性。 四 多层下钻归因方案—决策树 本节重点在拆解求出贡献率之后如何探查异动。我们已经把不同维度下每个维值的贡献率求出 下一步的目的是求出贡献最大有异动的的维度维值组合测三种拆解方案包括逐层下钻同上文3.4的下钻方式、多层同步下钻、 决策树模型发现决策树模型效果最好。这里决策树输入为不同的维值组合输出为贡献率做的是回归预测。 主要做法是求贡献率的熵找到信息增益最高切割方法。这里自然而然想到决策树模型通过贪心算法切割数据空间 找到贡献率绝对值最高的维度组合空间。图四长方形整体表示数据空间 表示两个维度其下角标表示维度下的维值。下图具象的看出通过不同维值的组合把数据空间切割成不同块用不同的颜色代表。 图四决策树对数据空间的切割可视化 1 剪枝 决策树存在过拟合的问题 为了解决这个问题我们决定了剪枝的方法采用后剪枝Post-pruning。后剪枝就是先把整颗决策树构造完毕然后自底向上的对非叶结点进行考察若将该结点对应的子树换为叶结点能够带来泛华性能的提升则把该子树替换为叶结点。 后剪枝的方法包括REP-错误率降低剪枝 PEP-悲观剪枝 CCP-代价复杂度剪枝 MEP-最小错误剪枝。 图五异动维数的个数与结点方差熵的关系 我们从图五的事例启发按照CPP的方法 找跃层增益较大的“拐点”找到合适的图片进行剪枝。 五 模型表现 1 模拟数据 我们模拟的维度和维值如下共4个维度两两独立 涉及维值共40个4个维度维值组合笛卡尔积 3123*4744共744个。模拟的时间对比为月环比模拟指标为广告消耗。 无异动数据用白噪音图片模拟无异动的维度组合的时间序列见图六 图六无异动的时间序列 有异动数据用随机游走的累积和来模拟异动公式如下见图七 图七a有异动的时间序列1 2 模型评估 在上图四个维度国家、渠道、端型、曝光档位指定特定的维度和维值在3月有异动通过决策树模型测试是否找到正确异动点。模拟case考虑的主要是可能存在异动的真实情况 某个PID数据录入异常会影响单维度的异动仅那个PID的数据。某个渠道且某个端型的减投会影响多个维度组合的异动。由于指标异动涉及的业务繁杂不同团队在不同方向的优化影响到不同的维值组合。 例一异动维度在两处 异动维值组合 a. 国家伊拉克 渠道免费, 端型WAP, 曝光档位[5:100] b. 国家法国 渠道免费, 端型PC, 曝光档位[0:5] 将贡献度算出数据输入决策树模型 结果见图八可以看出决策树精确的找到异动的数据共精确找到7个维值共8个 且这两组标红数据对于异动的贡献绝对值最大。我们自定义树结构找父节点的方法自动剪掉冗余分支只截取重点枝干呈现。 图八决策树结果呈现 特征重要性也符合预期 例二异动维度在一处只异动一个维度在付费上 异动维值组合a. 渠道付费 通过剪枝模型成功找到一维信息避免提供太多噪音令用户混淆。 更多 表一包含更多维值组合案例 以及模型表现包括F1-score模型输出的结果和特征重要性。已探索11个案例平均F1-score达到91.9%。 下面的数量是异动的维值个数 | Positive Prediction | Negative Prediction Positive Class | True Positive (TP) 34 | False Negative (FN) 6 Negative Class | False Positive (FP) 0 | True Negative (TN) 0 最后结果 Precision 34 / 34 0 100% Recall 34 / 34 6 85% F-1 Score Overall 91.9% 六 局限 但此方法论还是有其局限性的主要在于归因变量下钻维度有限大多数情况下是按照业务的理解和先验的经验来判断。本方法只能识别业务已经认可的拆解维度和链路定位拆解到的指标或维度都是已知业务系统内的指标诸如工程问题、宏观政策等因素难以识别需要辅以定性分析。具体来说我们看到pv下降下意识要去从渠道下钻主要原因是我们因为渠道作为变量是和pv数有正向或者因果关系的。举个极端的例子有可能是服务器的故障导致全平台的pv下跌。这样的潜在变量如果和常用下钻变量彼此相互独立的条件下是无法通过此方法论探查得到的。我们后续的工作将重点放在对相互独立的指标和相关事件的角度做进一步更全面的因果推断算法研究。 七 技术产品化 我们工作中月报和周报中通常分析的方法与此类似不同的是因为人力有限数据庞杂往往下钻维度和层数局限比率类型指标不知道如何下钻等等导致科学性和严谨性很难保持。这套方法实现了自动化保证计算的准确性节省人日。我们将此技术沉淀在内部数据产品“象数”上。象数中心是ICBU数据驱动的基石产品是集数据资产定义与管理、A/B实验、洞察分析于一体的数据平台。它提供的核心价值在于好找、敢用、持续保鲜的数据资产大规模、可信的端到端实验能力以及因果、异动等智能化的分析工具。 八 附录 证明 加法贡献算法 已知  贡献等于 证明 乘法贡献算法 已知  贡献等于 目标波动 证明 比率贡献算法 已知 , 其中是当月的数据为上个月同比/环比的数据。  贡献等于 算法得到的贡献率依旧相互独立符合MECE原则且通过分别观测图片和图片有助于我们避开辛普森悖论带来的陷阱。 备注 符合mece原则证明相互独立和的计算公式中不涉及其他分项的完全穷尽。 参考 Ang, Beng W., F. Q. Zhang, and Ki-Hong Choi. Factorizing changes in energy and environmental indicators through decomposition. Energy 23.6 (1998): 489-495. Ang B W . The LMDI approach to decomposition analysis: a practical guide[J]. Energy Policy, 2005, 33(7):867-871. 《波动解读—指标拆解的加减乘除双因素》《波动解读—指标拆解的加减乘除双因素》 - 知乎 原文链接 本文为阿里云原创内容未经允许不得转载。
http://www.huolong8.cn/news/366638/

相关文章:

  • 园林效果图网站中国企业500强排行榜
  • 打开网站很慢网络营销优缺点
  • 图派科技做网站怎么样石林网站建设
  • 响应式网站建设流程郑州工商注册
  • 重庆皇华建设集团有限公司网站求主题wordpress源码
  • 深圳网站建设价格多少钱怎样建设一个能上传数据的网站
  • 怎么用vs2010做网站网络的推广
  • 自己做一个网站需要多少钱衡水seo_衡水网站建设-燕丰收
  • 网站轮播效果怎么做的做qq群头像网站
  • 品牌咖啡主题网页界面设计竞价推广和seo的区别
  • 企业网站的建立多少钱wordpress如何导入主题
  • 北京建站管理系统价格佛山做网站公司排名
  • 网站开发需要哪些人才网站建设前景如何
  • 网站开发的一次性收益wordpress 后台设置
  • 搜狐做app的网站个人养老保险怎么买
  • 长沙 网站开发报价黄国外网站
  • 杭州品牌网站设计互联网销售是什么意思
  • php网站后台商务网站开发公司
  • 快速搭建网站demo注册logo商标设计要求
  • 广西建设科技与建筑节能协会网站wordpress被镜像
  • 建设网站的风险分析wordpress content widgets
  • 做网站全屏尺寸是多少钱网络推广营销策划方案
  • o2o网站建设特色大连网站建设招聘网
  • 网站建设的主要结构关于旅游网站建设的摘要
  • 个人制作个网站合肥知名网站建设公司
  • 慕课网站开发吉林省建设信息网官网
  • 网站需要哪些费用在线设计房屋效果图
  • 网站建设阿里云中国企业信息网查询系统官网
  • 网站设计应该遵循哪些原则完整网站开发视频
  • 广告公司网站(附falsh及源代码)长春建设厅网站首页