如何分析网站开发语言,石景山广州网站建设,网页生成桌面快捷方式,洛阳制作网站ihanshi肝了半天再加一个晚上。。 之前学了一小段时间的TensorFlow#xff0c;但是今天练习赛时发现根本没啥用。。。第一阶段早就做完了#xff0c;今天做的都是第二阶段#xff0c;都是啥玩意题 又是偏度#xff0c;又是求系数#xff0c;又是拟合KNN#xff0c;真的把人看吐…肝了半天再加一个晚上。。 之前学了一小段时间的TensorFlow但是今天练习赛时发现根本没啥用。。。第一阶段早就做完了今天做的都是第二阶段都是啥玩意题 又是偏度又是求系数又是拟合KNN真的把人看吐了基本上都是现学现用查阅了半天资料翻了无数遍csdn才有些头绪 结构化数据的题应该做出八道做出八道才可以开启第三阶段 其中有四个题是蒙出来的。。。因为这四个题基本上输出就是0或1虽然有提交次数但还是顽强的试出来了。。。 做出四个1,23,5 求偏度和boxcox1p变化都是有固定函数的直接套用即可 偏度skew() 第二题计算体重的偏度
import scipy.stats as st
import pandas as pd
pd.options.display.max_columns None
pd.options.display.max_rows None
path1 /home/kesci/input/liver_df9751/结构化数据训练营.csv # chipotle.tsv
df pd.read_csv(path1)
df.head(30)
aveTime df[Weight\n体重].median()
chipo[Weight\n体重].nunique()
df2 df.fillna(aveTime)
col df2.iloc[:, 3]
arrs col.values
##print(arrs)
wst.skew(arrs) # 计算偏度
## 0.7565543738808015
print(%.4f%w)
boxcox1p变换boxcox1p 用boxcox1p对体重做变换lambda0.1变化后的数据的偏度是多少
import scipy.stats as st
import pandas as pd
from scipy.special import boxcox1p
pd.options.display.max_columns None
pd.options.display.max_rows None
path1 /home/kesci/input/liver_df9751/结构化数据训练营.csv # chipotle.tsv
df pd.read_csv(path1)aveTime df[Weight\n体重].median()
wt df[Weight\n体重].fillna(aveTime)lam0.1
wt boxcox1p(wt, lam)
wst.skew(wt.values) # 计算偏度
## 0.7565543738808015
print(%.4f%w)
第五题我真的要好好说说真的绝了线上题 用上题同样的数据拟合KNNK5,分类结果和真实结果不一致的有多少个 上题同样的数据指的是只选取年龄、体重和 ALF缺失值用中位数填充不做任何额外处理
我一遍一遍的翻资料看了无数个KNN的文章重要在一个文章找到KNN的用法KNN也是有函数的KNeighborsClassifier(n_neighbors5)里面的n_neighbors也就是题目中的K 我们得到了分类结果但是并不够真实结果是什么我们一直没想明白因为我们把所有数据都作为训练集来训练KNN就是KNN的生成是需要数据的然后还需要数据来测试但是题目只给了一套数据后来我在想会不会是自身生成的KNN来检测自身也就是用训练集生成的分类结果来检验自身的分类结果 于是我和同学输出了分类结果和原数据自身的结果发现不相等差值即为答案
import scipy.stats as st
import pandas as pd
import regex as re
pd.options.display.max_columns None
pd.options.display.max_rows None
path1 /home/kesci/input/liver_df9751/结构化数据训练营.csv # chipotle.tsv
# path2/home/kesci/inputver_df9751/结构化数据训练营测试集.csv
data pd.read_csv(path1)
# data_testpd.read_csv(path1)
col_nameslist(data.columns)
col[]
for i in range(len(col_names)):if re.findall(r\u2028(.),col_names[i])![]:col.append(re.findall(r\u2028(.),col_names[i])[0])elif re.findall(r\n(.),col_names[i])![]:col.append(re.findall(r\n(.),col_names[i])[0])else:col.append(col_names[i])
## 修改dataframe列名
data.columnscol
feature1 [体重,年龄,ALF]
for i in feature1:avedata[i].median()data[i] data[i].fillna(ave)print(data[i].values)
a_zi[]
for i in range(len(data)):c[data[体重][i],data[年龄][i]]a_zi.append(c)from sklearn.neighbors import KNeighborsClassifierneigh KNeighborsClassifier(n_neighbors5)
neigh.fit(a_zi, data[ALF])
cnt0
for i in range(len(a_zi)):if(neigh.predict([a_zi[i]])data[ALF][i]):cnt1
print(len(a_zi),cnt,len(a_zi)-cnt)
真的是绝了绝了。。。 明天继续肝