当前位置: 首页 > news >正文

怎么建设一个手机网站石家庄建设工程施工安全服务平台

怎么建设一个手机网站,石家庄建设工程施工安全服务平台,wordpress 流程,网站开发流程视频文章目录 关联规则引言相关名词 独热编码引言代码第一种第二种 关联规则 引言 在一家超市里#xff0c;有一个有趣的现象#xff1a;尿布和啤酒竟然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。 一个意外的发现是#xff1a;”跟尿布一起购买最多的… 文章目录 关联规则引言相关名词 独热编码引言代码第一种第二种 关联规则 引言 在一家超市里有一个有趣的现象尿布和啤酒竟然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。 一个意外的发现是”跟尿布一起购买最多的商品竟是啤酒经过大量实际调查和分析揭示了一个隐藏在“尿布与啤酒”背后的美国人的一种行为模式在美国一些年轻的父亲下班后经常要到超市去买婴儿尿布而他们中有30%40%的人同时也为自己买一些啤酒。产生这一现象的原因是美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。 **关联规则(Association Rules)**是反映一个事物与其他事物之间的相互依存性和关联性是数据挖掘的一个重要技术用于从大量数据中挖掘出有价值的数据项之间的相关关系。 相关名词 支持度(support) 支持度是个百分比它指的是某个商品组合出现的次数与总次数之间的比例。支持度越高代表这个组合出现的频率越大。例如“牛奶 面包”出现了 3 次那么这 5 笔订单中“牛奶 面包”的支持度就是 3/50.6。 置信度(confidence) 置信度是个条件概念就是说在 A 发生的情况下B 发生的概率是多少。即就是当你购买了商品 A会有多大的概率购买商品 B。例如置信度牛奶→啤酒2/40.5代表如果你购买了牛奶有50%的概率会购买啤酒。 提升度(lift) 提升度代表的是“商品 A 的出现对商品 B 的出现概率提升的”程度。计算公式如下提升度 (A→B) 置信度 (A→B)/ 支持度 (B) 所以提升度有三种可能 1提升度 (A→B)1代表有提升 2提升度 (A→B)1代表没有提升也没有下降 3提升度 (A→B)1代表有下降。 独热编码 (One-Hot Encoding) 引言 独热编码出现之前针对无序离散的分类特征机器学习算法的分类器并不能直接进行数据处理。因为分类器通常处理的数据是连续且有序的。 独热编码即 One-Hot 编码又称一位有效编码。其方法是使用 N位 状态寄存器来对 N个状态 进行编码每个状态都有它独立的寄存器位并且在任意时候其中只有一位有效即只有一位是1其余都是零值 例如对4种状态进行编码 自然顺序码为00011011 独热编码为0001001001001000 按照 N位状态寄存器 来 对N个状态 进行编码的原理处理后应该是这样的 性别特征[“男”“女”]N2 二维数据 男 10 女 01 地区特征[“北京”上海“深圳”]N3三维数据 北京 100 上海 010 深圳 001 运动特征[“足球”“篮球”“羽毛球”“乒乓球”]N4 足球 1000 篮球 0100 羽毛球 0010 乒乓球 0001 当一个样本为 [“男”,“上海”,“足球”] 的时候独热编码One-Hot Encoding的结果为 [1,0,0,1,0,1,0,0,0] 代码 第一种 from sklearn import preprocessing enc preprocessing.OneHotEncoder() enc.fit([[0,0,3],[1,1,0],[0,2,1],[1,0,2]]) # 训练。这里共有4个数据3种特征array enc.transform([[0,1,3]]).toarray() # 测试。这里使用1个新数据来测试array ##输出 array([[1., 0., 0., 1., 0., 0., 0., 0., 1.]])总共有三个特征 第一个特征有两类[0,1]表示成10,01 第二个特征有三类[0,1,2]表示成100,010,001 第三个特征有四类[0,1,2,3]表示成1000,0100,0010,0001 第二种 encoder preprocessing.OneHotEncoder() encoder.fit([[0, 2, 1, 12],[1, 3, 5, 3],[2, 3, 2, 12],[1, 2, 4, 3] ]) encoded_vector encoder.transform([[2, 3, 5, 3]]).toarray() encoded_vector4个特征 第一个特征将3类特征值[0,1,2]表示为[100,010,001] 第二个特征将2类特征值[2,3]表示为[10,01] 第三个特征将4类特征值[1,2,4,5]表示为[1000,0100,0010,0001] 第四个特征将2类特征值[3,12]表示为[10,01] 区别就是第二种的特征值是随机的
http://www.huolong8.cn/news/283549/

相关文章:

  • 什么网站可以做软件有哪些做一个网址需要多少钱
  • 盘县网站开发百度指数是什么
  • 北京人才招聘网站上海人才网官方网站
  • 做淘宝要网站佛山网站建设企业
  • 安徽做网站哪家好学网站建设工作
  • 潍坊哪里可以做网站wordpress自定义文章类型
  • 漂流瓶做任务网站怎么制作一个最简单的网站
  • 深圳营销型网站建设 宝安西乡广东企业网站建设
  • 网站建设问题分类和排除方法分析福建省铁路建设办公室网站
  • 网站开发 后端服务wordpress5.21开启多站点
  • liferay 做网站服装公司介绍模板
  • 外贸网站建设及推广网站vip怎么做
  • 免费自创网站沙漠风网站开发怎样
  • 算命手机网站开发福田瑞沃前四后四车价格
  • 怎样上传网站到百度知乎网站内容建设的逻辑
  • 网站经营内容做合成照片的国外网站
  • 手机 网站 翻页 外部做网站的技术理论
  • 成立网站是不是需要先成立公司手机网站竞价
  • 用cms做网站的具体步骤wordpress 主题和插件下载失败
  • 如何评判网站建设岗位网站 如何做后台维护
  • 建设一个直播网站如何更改网站关键词
  • 建设厅网站ca验证失败企业网站建设综合实训心得体会一千字
  • 亳州电商网站建设关于学校网站建设经费的申请
  • 郑州金水区做网站公司网站内容管理软件
  • 无锡网站建设xinysu上海企业云
  • 南宁高新区建设房产局网站wordpress整站源码带数据
  • 商标免费设计在线生成跟我学seo
  • 重庆当地网站杭州门户网站建设公司
  • 怎么用本机ip做网站wordpress add_theme_page
  • 自适应网站主要用什么做重庆潼南网站建设