当前位置: 首页 > news >正文

出口贸易公司网站怎么做开发安卓软件用什么工具

出口贸易公司网站怎么做,开发安卓软件用什么工具,广告优化师属于什么行业,台州网站建设兼职在R中进行基于稳健马氏距离的异常检验 前言 我们研究的数据中经常包含着一些不同寻常的样本#xff0c;这称之为异常值(Outlier)。这些异常值会极大的影响回归或分类的效果。异常值产生的原因有很多#xff0c;其中可能是人为错误、数据测量误差#xff0c;或者是实际确实存…在R中进行基于稳健马氏距离的异常检验 前言   我们研究的数据中经常包含着一些不同寻常的样本这称之为异常值(Outlier)。这些异常值会极大的影响回归或分类的效果。异常值产生的原因有很多其中可能是人为错误、数据测量误差或者是实际确实存在这样的异常。为了使模型能够反映大部分数据的规律所以在数据预处理阶段要进行异常值检测为下一步分析奠定基础。还有一类情况是当研究人员希望发现不平凡的事物时异常值检测本身就是分析的首要目的。例如在信用卡欺诈、计算机入侵检测等问题中。此时由于样本的不平衡性导致一般的分类方法无法使用必须转而考虑异常检测方法。   一种常用的异常检验思路是观察各样本点到样本中心的距离。如果某些样本点的距离太大就可以判断是异常值。这里距离的度量一般使用马氏距离(Mahalanobis Distance)。因为马氏距离不受量纲的影响而且在多元条件下马氏距离还考虑了变量之间的相关性这使得它优于欧氏距离。   但是传统的马氏距离检测方法是不稳定的因为个别异常值会把均值向量和协方差矩阵向自己方向吸引这样算出来的样本马氏距离起不了检测异常值的所用。所以首先要利用迭代的思想构造一个稳健的均值和协方差矩阵估计量然后计算稳健马氏距离(Robust Mahalanobis Distance)。这样使得异常值能够正确地被识别出来。   在mvoutlier包中提供了基于稳健马氏距离的异常值检验方法。我们首先构造一个二维变量的人工数据其中80个样本是标准正态分布另一小撮别有用心的样本是均值为5标准差为1的观测值。我们首先使用uni.plot函数在一维空间中观察这个数据。 library(mvoutlier)set.seed(1234)x - cbind(rnorm(80), rnorm(80))y - cbind(rnorm(10, 5, 1), rnorm(10, 5, 1))z - rbind(x,y)# 一维数据的异常检验res1 - uni.plot(z)# 返回异常值的编号which(res1$outliersT)################################ library(mvoutlier) set.seed(1234) x - cbind(rnorm(80), rnorm(80)) y - cbind(rnorm(10, 5, 1), rnorm(10, 5, 1)) z - rbind(x,y) # 一维数据的异常检验 res1 - uni.plot(z) # 返回异常值的编号 which(res1$outliersT)[1] 20 62 81 82 83 84 85 86 87 88 89 90   上图中红色点表示疑似异常值因为它偏离均值太远。更多时候我们会处理多元异常检测问题此时用aq.plot函数来实行基于稳健马氏距离的异常值检验方法。下图中左上角图形为原始数据右上角图形的X轴为各样本的稳健马氏距离排序Y轴为距离的经验分布红色曲线为卡方分布蓝色垂线表示阀值在阀值右侧的样本判断为异常值。左下和右下两张图均是用不同颜色来表示异常值只是阀值略有不同。可以观察到那一小撮异常值被正确的判断出来但也有两个正常值被误判为异常值此时需要调整参数。 # 基于稳健马氏距离的多元异常值检验res2 -aq.plot(z)# 返回异常值的编号which(res2$outliersT)################################ res2 -aq.plot(z) which(res2$outliersT)[1] 20 62 81 82 83 84 85 86 87 88 89 90   如果数据的维数过高例如基因数据那样几千个变量数据之间变得稀疏从而使得距离不再有很大意义。此时可以融合主成分降维的思路来进行异常值检验。mvoutlier包中提供了pcout函数来进行高维空间异常检验。下面是以swiss数据集为例来判断异常值。 # 在高维空间中的异常值检验data(swiss)res3 - pcout(swiss)# 返回异常值的编号which(res3$wfinal010)################################ # 在高维空间中的异常值检验 data(swiss) res3 - pcout(swiss) # 返回异常值的编号 which(res3$wfinal010)Delemont Franches-Mnt Porrentruy Broye Glane 2 3 6 7 8 Gruyere Sarine Veveyse La Vallee Conthey 9 10 11 19 31 Entremont Herens Martigwy Monthey St Maurice 32 33 34 35 36 Sierre Sion V. De Geneve 37 38 45 参考资料 R语言处理异常值1R语言处理异常值2转载于:https://www.cnblogs.com/cloudtj/articles/5520230.html
http://www.yutouwan.com/news/22208/

相关文章:

  • 服装公司网站网页设计网站做302重定向
  • asp企业网站cmswordpress 新闻发布
  • 大良营销网站建设平台甘肃网络公司网站建设
  • 建网站怎样往网站传视频宁波咨询网站设计
  • 网站背景图片代码上海市建筑业官网
  • 网站开发案例教程做网站的学校有哪些
  • 网站管理建设网店怎么经营才能好啊
  • 百度网站建设目标女孩学建筑学好找工作吗
  • 做网站的计划概要网站维护运行建设报告
  • 孝感住房和城乡建设部网站网站开发公司上海
  • 建设一个网站的过程html个人网页制作模板
  • 网站403错误泉州网站建设选择讯呢
  • 公司网站模板设计网站建设投资资金
  • 茂名公司网站开发公司东莞做网站建设公司
  • 游戏介绍网站模板上海网站设计公司推荐亿企邦
  • 男女做暧暧试看网站怎么创建收费网站
  • 江门网站推广优化广告设计专业学校有哪些
  • 无锡网站建设和申请域名之后如何做网站
  • 请简述网站开发的流程图cms系统免费
  • 如何建设景区旅游网站营销运营管理
  • wordpress前台多语言版苏州优化价位
  • 做网站本溪dede网站建设流程
  • frp做网站毕业设计都是做网站吗
  • 做暧暧暖网站欧美网站哪里买外链
  • 传奇服务器如何做网站深圳市市场监督管理局官网
  • 哪有做网站学做网站看那个网
  • 行业门户网站建设wordpress 文字颜色
  • 学做巧裁缝官方网站网站开发毕业设计书
  • 搜索网站排名软件网店推广1+x证书
  • 电商网站建设包括哪些内容北京室内设计公司排名榜