当前位置: 首页 > news >正文

顺丰电子商务网站建设如何开发一个微网站

顺丰电子商务网站建设,如何开发一个微网站,网站建设 设计,旅游景区网站模板目录 一、数据集及分析对象 二、目的及分析任务 三、方法及工具 四、数据读入 五、数据理解 六、数据准备 七、模型训练 八、模型评价 九、模型调参 十、模型预测 实现回归分析类算法的Python第三方工具包比较常用的有statsmodels、statistics、scikit-learn等#…目录 一、数据集及分析对象 二、目的及分析任务 三、方法及工具 四、数据读入 五、数据理解 六、数据准备 七、模型训练 八、模型评价 九、模型调参 十、模型预测 实现回归分析类算法的Python第三方工具包比较常用的有statsmodels、statistics、scikit-learn等下面我们主要采用statsmodels。 一、数据集及分析对象 CSV文件——“women.csv”。 数据集链接https://download.csdn.net/download/m0_70452407/88519967 该数据集给出了年龄在30~39岁的15名女性的身高和体重数据主要属性如下 1height身高 2weight体重 二、目的及分析任务 理解机器学习方法在数据分析中的应用——采用简单线性回归、多项式回归方法进行回归分析。 1训练模型。 2对模型进行拟合优度评价和可视化处理验证简单线性回归建模的有效性。 3采用多项式回归进行模型优化。 4按多项式回归模型预测体重数据。 三、方法及工具 Python语言及第三方工具包pandas、matplotlib和statsmodels。 四、数据读入 import pandas as pd df_womenpd.read_csv(D:\\Download\\JDK\\数据分析理论与实践by朝乐门_机械工业出版社\\第3章 回归分析\\women.csv,index_col0) 五、数据理解 对数据框df_women进行探索性分析。 df_women.describe() df_women.shape (15, 2) 接着对数据库df_women进行数据可视化分析通过调用mayplotlib.pyplot包中数据框DataFrame的scatter()方法绘制散点图。 import matplotlib.pyplot as plt plt.scatter(df_women[height],df_women[weight]) 从输出结果可以看出女性身高与体重之间的关系可以进行线性回归分析需要进一步进行数据准备工作。 六、数据准备 进行线性回归分析之前应准备好模型所需的特征矩阵X和目标向量y。这里我们采用Python的统计分析包statsmodel进行自动类型转换。 Xdf_women[height] ydf_women[weight] 七、模型训练 以女性身高height作为自变量、体重weight作为因变量对数据进行简单线性回归建模这里采用Python的统计分析包statsmodels中的OLS函数进行建模分析。 import statsmodels.api as sm statsmodels.OLS()方法的输入有endog,exog,missing,hasconst4个其中endog是回归中的因变量即上述模型中的weightexog则是自变量的值即模型中的height。 默认情况下statsmodels.OLS()方法不含截距项因此应将模型中的常数项看作基为1的维度上的系数。所以exog的输入中最左侧的一列的数值应全为1。这里我们采用statsmodels中提供的可直接解决这一问题的方法——sm.add_constant()给X新增一列列名为const每行取值为1.0 X_add_constsm.add_constant(X) X_add_const 在自变量X_add_const和因变量y上使用OLS()方法进行简单线性回归。 myModelsm.OLS(y,X_add_const) 然后获取拟合结果并调用summary()方法显示回归拟合的结果。 resultsmyModel.fit() print(results.summary()) OLS Regression Results Dep. Variable: weight R-squared: 0.991 Model: OLS Adj. R-squared: 0.990 Method: Least Squares F-statistic: 1433. Date: Thu, 09 Nov 2023 Prob (F-statistic): 1.09e-14 Time: 18:28:09 Log-Likelihood: -26.541 No. Observations: 15 AIC: 57.08 Df Residuals: 13 BIC: 58.50 Df Model: 1 Covariance Type: nonrobust coef std err t P|t| [0.025 0.975] ------------------------------------------------------------------------------ const -87.5167 5.937 -14.741 0.000 -100.343 -74.691 height 3.4500 0.091 37.855 0.000 3.253 3.647Omnibus: 2.396 Durbin-Watson: 0.315 Prob(Omnibus): 0.302 Jarque-Bera (JB): 1.660 Skew: 0.789 Prob(JB): 0.436 Kurtosis: 2.596 Cond. No. 982. Notes: [1] Standard Errors assume that the covariance matrix of the errors is correctly specified. C:\ProgramData\Anaconda3\lib\site-packages\scipy\stats\_stats_py.py:1769: UserWarning: kurtosistest only valid for n20 ... continuing anyway, n15warnings.warn(kurtosistest only valid for n20 ... continuing 上述运行结果中第二部分的coef列所对应的const和height就是计算出的回归模型中的截距项和斜率。 除了读取回归摘要外还可以调用params属性查看拟合结果的斜率和截距。 results.params const -87.516667 height 3.450000 dtype: float64 从输出结果可以看出回归模型中的截距项和斜率分别为-87.516667和3.450000 八、模型评价 以R^2决定系数作为衡量回归直线对观测值拟合程度的指标其取值范围为[0,1]越接近1说明“回归直线的拟合优度越好”。可以调用requared属性查看拟合结果的R^2 results.rsquared 0.9910098326857505 除了决定系数等统计量还可以通过可视化方法更直观地查看回归效果。这里我们调用matplotlib.pyplot包中的plot()方法将回归直线与真实数据绘制在一个图中进行比较。 y_predictresults.params[0]results.params[1]*df_women[height] plt.rcParams[font.family]simHei #汉字显示 字体设置 plt.plot(df_women[height],df_women[weight],o) plt.plot(df_women[height],y_predict) plt.title(女性身高与体重的线性回归分析) plt.xlabel(身高) plt.ylabel(体重) 从输出结果可以看出采用简单线性回归模型的效果还可以进一步优化为此采取多项式回归方法进行回归分析。 九、模型调参 调用Python的统计分析包statsmodels中的OLS()方法对自变量女性身高height、因变量体重weight进行多项式回归建模。 假设因变量y与自变量X、X^2、X^3存在高元线性回归因此在多项式分析中特征矩阵由3部分组成即X、X^2和X^3。通过调用numpy库的column_stack()方法创建特征矩阵X。 import numpy as np Xnp.column_stack((X,np.power(X,2),np.power(X,3))) 通过sm.add_constant()方法保留多项式回归中的截距项。对自变量X_add_const和因变量y使用OLS()方法进行多项式回归。 X_add_constsm.add_constant(X) myModel_updatedsm.OLS(y,X_add_const) resultsmyModel_updated.fit() print(results.summary()) OLS Regression Results Dep. Variable: weight R-squared: 1.000 Model: OLS Adj. R-squared: 1.000 Method: Least Squares F-statistic: 1.679e04 Date: Thu, 09 Nov 2023 Prob (F-statistic): 2.07e-20 Time: 18:46:54 Log-Likelihood: 1.3441 No. Observations: 15 AIC: 5.312 Df Residuals: 11 BIC: 8.144 Df Model: 3 Covariance Type: nonrobust coef std err t P|t| [0.025 0.975] ------------------------------------------------------------------------------ const -896.7476 294.575 -3.044 0.011 -1545.102 -248.393 x1 46.4108 13.655 3.399 0.006 16.356 76.466 x2 -0.7462 0.211 -3.544 0.005 -1.210 -0.283 x3 0.0043 0.001 3.940 0.002 0.002 0.007Omnibus: 0.028 Durbin-Watson: 2.388 Prob(Omnibus): 0.986 Jarque-Bera (JB): 0.127 Skew: 0.049 Prob(JB): 0.939 Kurtosis: 2.561 Cond. No. 1.25e09 Notes: [1] Standard Errors assume that the covariance matrix of the errors is correctly specified. [2] The condition number is large, 1.25e09. This might indicate that there are strong multicollinearity or other numerical problems. C:\ProgramData\Anaconda3\lib\site-packages\scipy\stats\_stats_py.py:1769: UserWarning: kurtosistest only valid for n20 ... continuing anyway, n15warnings.warn(kurtosistest only valid for n20 ... continuing 从输出结果可以看出多项式回归模型中的截距项为-896.7476而X、X^2、X^3对应的斜率分别为46.4108、-0.7462和0.0043 调用requared属性查看拟合结果的R^2 results.rsquared 0.9997816939979361 从决定系数的结果可以看出多项式回归模型的效果比简单线性回归模型的效果更好。 十、模型预测 使用该多项式回归模型进行体重预测并输出预测结果。 y_predict_updatedresults.predict() y_predict_updated array([114.63856209, 117.40676937, 120.18801264, 123.00780722,125.89166846, 128.86511168, 131.95365223, 135.18280543,138.57808662, 142.16501113, 145.9690943 , 150.01585147,154.33079796, 158.93944911, 163.86732026]) 多项式回归模型的可视化 y_predict(results.params[0]results.params[1]*df_women[height]results.params[2]*df_women[height]**2results.params[3]*df_women[height]**3)plt.plot(df_women[height],df_women[weight],o) plt.plot(df_women[height],y_predict) plt.title(女性身高与体重的多项式回归分析) plt.xlabel(身高) plt.ylabel(体重) 从结果可以看出采用多项式回归后拟合效果显著提高结果较为令人满意。
http://www.huolong8.cn/news/13108/

相关文章:

  • 郑州市精神文明建设 网站河南中原建设公司网站
  • 商丘做网站多少钱网站推广的公司
  • 东莞网站优化公司哪家好免费一键生成详情页
  • 怎么建设卡盟网站做网页的兼职平台
  • 10个网站做站群网上注册公司流程图文
  • 个个大公司网站wordpress 侧边栏 修改字体大小
  • 创意家居网站建设与管理广告发布服务属于什么服务
  • vs做的网站项目可以改名字吗制作类网站
  • html5经管网站模板展示类网站建设
  • cdr做网站流程seo怎么做推广
  • 网站定制与模板开发wordpress主题akina
  • 东阳网站建设怎么选nana wordpress主题安全不
  • 常州武进区建设局网站7大常务现在职位名单
  • 房产门户网站平台搭建网页制作培训教案
  • win2008r做网站云龙微网站开发
  • 专门做鞋子的网站有哪些论坛企业推广
  • 网站建设哪些资质网站ftp怎么登陆
  • 健康养老网站建设如何做旅游网站的思维导图
  • 做网站上市的公司长春网站优化团队
  • 网站设计流程大致分为几个阶段arial 网站开发是用犀利
  • 电大形考任在哪个网站做做网站ftp
  • 购物网站分为几个模块室内设计素材
  • 网站内做动图wordpress模版 使用教程
  • 天津经济持续恢复网站优化的方法
  • 你认为优酷该网站哪些地方可以做的更好_为什么?花的网页设计模板素材
  • 网站建设 诺德中心wordpress 定制搜索
  • 电信网站备案流程图seo引擎优化软件
  • 济南网站建设制作建设监理继续教育网站
  • 建设档案员证书查询网站做一款什么网站赚钱
  • 高端html5网站设计工作室织梦模板 dedecms5.7怎么做一个属于自己的网页