当前位置: 首页 > news >正文

教育学校网站做管理系统和网站哪个好做

教育学校网站做,管理系统和网站哪个好做,wordpress api下载,普通网站 手机网站1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失#xff0c;两者都会造成分析结果的不准确#xff0c;以下从缺失值产生的原因及影响扥方面展开分析。 #xff08;1#xff09;缺失值产生的原因 1#xff09;有些信息暂时无法获取#xff0c;或…1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失两者都会造成分析结果的不准确以下从缺失值产生的原因及影响扥方面展开分析。 1缺失值产生的原因 1有些信息暂时无法获取或者获取信息的代价太大 2有些信息是被遗漏的。可能是因为输入时认为不重要、忘记填写或对数据理解错误等一些人为因素而遗漏也可能是由于数据采集设置的故障、存储介质的故障、传输媒体的故障灯非人为原因而丢失 3属性值不存在。在某些情况下缺失值并不意味着数据有错误。对一些对象来说某些属性是不存在的如一个未婚者的配偶姓名、一个儿童的固定收入等。 2缺失值的影响 1数据挖掘建模将丢失大量的有用信息 2数据挖掘模型所表现出的不确定性更加显著模型中蕴涵的规律更难把握。 3包含空值的数据会使建模过程陷入混乱导致不可靠的输出。 3缺失值的分析 使用简单的统计分析可以得到含有缺失值的属性的个数以及每个属性的未缺失数、缺失数与缺失率等。 从总体上来说缺失值的处理分为删除存在缺失值的记录、对可能值进行插补和不处理3种情况。 2.缺失值处理 import pandas as pd import numpy as np df pd.read_csv(data/table_missing.csv) #默认输出DataFrame的前5行 df.head() 1了解缺失数据 函数isna和notna方法 df[Physics].isna().head() df[Physics].notna().head() 统计每列每行的缺失情况 #统计每列的缺失 df.isna().sum()#或者df.isnull().sum() #统计每行的缺失 df.isna(axis0).sum()#或者df.isnull(axis0).sum() 挑出该列缺失值的行 df[df[Physics].isna()] 挑选出所有非缺失值的列 这里介绍了all和any的用法all是全部值any是至少有一个值 #all是全部非缺失值 df[df.notna().all(1)] #any至少有一个不是缺失值 df[df.notna().any(1)] 2三种缺失符号 anp.nan 它不等与任何东西甚至不等于自己¶ 在用equals函数比较时自动略过两侧全是np.nan的单元格 在numpy中的类型为浮点由此导致数据集读入时即使原来是整数的列只要有缺失值就会变为浮点型 对于布尔类型的列表如果是np.nan填充那么它的值会自动变为True而不是False但当修改一个布尔列表时会改变列表类型而不是赋值为True 在所有的表格读取后无论列是存放什么类型的数据默认的缺失值全为np.nan类型因此整型列转为浮点而字符由于无法转化为浮点因此只能归并为object类型O原来是浮点型的则类型不变。 bNone None比前者稍微好些至少它会等于自身 它的布尔值为False 修改布尔列表不会改变数据类型 在传入数值类型后会自动变为np.nan 只有当传入object类型是保持不动几乎可以认为除非人工命名None它基本不会自动出现在Pandas中 在使用equals函数时不会被略过因此下面的情况下返回False¶ cNaT NaT是针对时间序列的缺失值是Pandas的内置类型可以完全看做时序版本的np.nan与自己不等且使用equals是也会被跳过。 3Nullable类型与NA符号 aNullable整形 对于该种类型而言它与原来标记int上的符号区别在于首字母大写‘Int’好处在于缺失值的类型都被替换成统一的NA符号且不改变数据类型。 bNullable布尔  与Nullable整型一致且数据类型不会变成浮点型 cstring类型 为了区分开原本含糊不清的object类型它本质上也属于Nullable类型因为不会含有缺失而改变类型 与object类型的一点重要区别就在于在调用字符方法后string类型返回的是Nullable类型object则会根据缺失类型和数据类型而改变。 4NA的特性 a逻辑运算 只需看该逻辑运算的结果是否依赖pd.NA的取值如果依赖则结果还是NA如果不依赖则直接计算结果取值不明直接报错 b算术运算和比较运算 当出现pd.NA**0和1**pd.NA时结果为1其他情况为NA 5convert_dtypes方法 在读取数据时就把数据列转为Nullable是pandas1.0的新函数。 pd.read_csv(data/table_missing.csv).convert_dtypes().dtypes 3.缺失数据的运算与分组 a加号和乘号规则 使用加法时缺失值为0 使用乘法时缺失值为1 使用累计函数时缺失值自动略过 bgroupby方法中的缺失值 自动忽略为缺失值的组 df_g pd.DataFrame({one:[A,B,C,D,np.nan],two:np.random.randn(5)}) print(df_g) df_g.groupby(one).groups4.填充与剔除 afillna方法值填充与前后向填充methodsffill or bfill #值填充 df[Physics].fillna(missing).head() #前向填充 df[Physics].fillna(methodffill).head() #后向填充 df[Physics].fillna(methodbackfill).head() 指定列填充 df_f pd.DataFrame({A:[1,3,np.nan],B:[2,4,np.nan],C:[3,5,np.nan]}) #填充全部列 df_f.fillna(df_f.mean()) #填充A,B两列 df_f.fillna(df_f.mean()[[A,B]]) bdropna方法 axis参数是行或列的参数如果axis0则对应是每一行如果axis1,则对应没一列 how参数是可以选择all或者是any表示全为缺失去除或存在缺失去除 subset参数是在某一列范围中搜索缺失值 5.插值interpolation 常见的数据插补方法有 1线性插值 a与索引无关的线性插值 默认状态下interpolate会对缺失的值进行线性插值 s pd.Series([1,10,15,-5,-2,np.nan,np.nan,28]) s.interpolate() b与索引有关的线性插值 method中的index和time选项可以是插值线性地依赖索引即插值为索引的线性函数 s.interpolate(methodindex) 如果索引是时间那么可以按照时间长短插值。 s_t pd.Series([0,np.nan,10],index[pd.Timestamp(2012-05-01),pd.Timestamp(2012-05-07),pd.Timestamp(2012-06-03)]) #未按照time插值图1 s_t.interpolate() #按照time插值图2 s_t.interpolate(methodtime) 2高级插值方法 与线性插值相比较例如样条插值、多项式插值、阿基玛插值等可进一步学习。 ser pd.Series(np.arange(1, 10.1, .25) ** 2 np.random.randn(37)) missing np.array([4, 13, 14, 15, 16, 17, 18, 20, 29]) ser[missing] np.nan methods [linear, quadratic, cubic] df pd.DataFrame({m: ser.interpolate(methodm) for m in methods}) df.plot() 3interpolate的限制参数 alimit最多插入多少个s.interpolate(limit2) blimit_direction表示插值方向可选forwordbackwardboth默认前向s.interpolate(limit_directionbackward) climit_area表示插值区域可选insideoutside默认Nones.interpolate(limit_areainside) 练习题 1如何删除缺失值在25%以上的列 s.drop(s.columns[s.isna().sum()/s.shape[0]0.25],axis1)
http://www.yutouwan.com/news/54372/

相关文章:

  • 南昌企业建站系统模板网站做可信认证
  • 网站地图用法建设校园门户网站方案
  • 如何建微网站重庆企业vi设计公司
  • 深圳制作外贸网站老榕树智能建站系统
  • 百合怎么做网站设计师去哪找
  • 免费的小网站ao主题wordpress
  • asp网站漏洞修复插件重庆丰都建设局网站
  • 一个域名绑定多个网站如何把网站提交到百度
  • 商丘做网站用什么程序比较好百度搜索 网站图片
  • 请被人做网站平面素材网
  • 做任务赚q红包的网站深圳外贸英语培训
  • 网站建设的业务范围本地做网站顺序
  • 博罗企业网站建设公司网站建设框架
  • 施工企业在施工过程中发现工程设计图纸存在差错的seo最新快速排名
  • 汕头高端网站建设机电工程栏建设项目网站建设
  • 博达站群网站建设教程长沙投资公司排名
  • 手机做网站视频平台seo什么意思
  • 商城网站建设解决方案产品推广渠道有哪些
  • 网站建设开发案例教程怎么做坑人的网站
  • 手机网站开发与pc网站开发的不同商场网站建设模板
  • 晋江 网站建设 推广分享推广
  • 网站访问速度东莞地铁建设
  • 免费网站整站模板源码在线crm营销管理系统
  • python企业网站开发开发公司个人总结
  • 破解php网站后台账号密码安装完成wordpress后如何使用
  • 建设网站需要的资料手机网站建站cms
  • 南京网站推广¥做下拉去118cr网站收录量怎么提升
  • 一个带有网上购物功能的小型网站的开发费用网站开发公司是外包公司吗
  • 知识问答网站开发青海seo技术培训
  • 廊坊网站建设廊坊cms开源系统