网址与网站的区别,企业网站 报价,网站优化千牛帮,电子商务网站建设的书目录 什么是P-P图与Q-Q图
分位数
百分位数
Q-Q图步骤与原理
Shapiro-Wilk检验
绘制Q-Q图
绘制P-P图 什么是P-P图与Q-Q图
P-P图和Q-Q图都是用于检验样本的概率分布是否服从某种理论分布。
P-P图的原理是检验实际累积概率分布与理论累积概率分布是否吻合。若吻合#xf…目录 什么是P-P图与Q-Q图
分位数
百分位数
Q-Q图步骤与原理
Shapiro-Wilk检验
绘制Q-Q图
绘制P-P图 什么是P-P图与Q-Q图
P-P图和Q-Q图都是用于检验样本的概率分布是否服从某种理论分布。
P-P图的原理是检验实际累积概率分布与理论累积概率分布是否吻合。若吻合则散点应围绕在一条直线周围或者实际累积概率与理论累积概率之差分布在对称于以0为水平轴的带内。
Q-Q图的原理是检验实际分位数与理论分位数是否吻合。若吻合则散点应围绕在一条直线周围或者实际分位数与理论分位数之差分布在对称于以0为水平轴的带内。
P-P图和Q-Q图都是用于检验样本的概率分布是否服从某种理论分布。当检验样本的分布为正态分布时Q-Q图中直线斜率为待检测数据的标准差截距为均值。
特点P-P图Q-Q图用途评估累积概率分布函数CDF的拟合程度。评估样本分布与理论分布的拟合程度。横坐标标准化的观测值累积概率理论分布的分位数纵坐标样本观测值的累积概率理论分布的分位数判定标准直观看出CDF的拟合情况直线越接近对角线越好。点在45度对角线上越接近拟合越好。形状分析对于偏斜、尖峰等分布形状的评估较为直观。主要用于检验是否符合正态分布对称性等。数据量要求对数据量要求不敏感适用于各种分布的评估。在小样本下效果较好对数据量要求较高。
分位数
分位数, 指的就是连续分布函数中的一个点这个点对应概率p。若概率0p1随机变量X或它的概率分布的分位数Za是指满足条件p(X≤Za)α的实数。
百分位数
百分位数统计学术语如果将一组数据从小到大排序并计算相应的累计百分位则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为一组n个观测值按数值大小排列。如处于p%位置的值称第p百分位数。
Q-Q图步骤与原理
1将数据升序排列根据各点在该组数据中的位置算出累积概率计算累积概率时(若共n个数)第i个数的累积概率不是i/n而是用(i-0.5)/n。这可能是为了避免最后一个数的累积概率为1时反算出的积分上限为正无穷。
2根据累积概率反算出若为标准正态分布高斯函数的积分上限 3积分上限为横坐标数据点为纵坐标画出数据分布的QQ图
4根据数据的均值与标准差画出若该组数据为正态分布的QQ图。
P-P图与Q-Q图类似把分位数换成累积概率。
Shapiro-Wilk检验
Shapiro-Wilk检验是一种用于检验样本数据是否来自正态分布的统计方法。该检验是由Samuel Shapiro和Martin Wilk于1965年提出的。它基于一个假设即如果样本数据来自正态分布那么样本数据的顺序统计量应该与对应的理论累积分布函数之间存在线性关系。
Shapiro-Wilk检验的零假设是数据来自正态分布。如果检验结果的p值小于所选定的alpha级别那么否定假设被拒绝意味着样本数据不是来自正态分布。反之如果p值大于选定的alpha级别则不能拒绝零假设即数据可能来自正态分布。
绘制Q-Q图
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
plt.rcParams[font.sans-serif] [SimHei] # 防止中文标签乱码
plt.rcParams[axes.unicode_minus] False
# 生成一个示例数据集这里使用随机数据
np.random.seed(0)
data np.random.normal(loc50, scale5, size40) # 均值50标准差5
# 正态性检验 - Shapiro-Wilk检验
# Shapiro-Wilk检验基于W统计量对数据是否符合正态分布进行评估适用于各种样本大小
stat, p stats.shapiro(data)
print(Shapiro-Wilk正态性检验统计量:, stat)
print(Shapiro-Wilk正态性检验p值:, p)
plt.figure(figsize(6, 6))
# 绘制概率图probability plot
# stats.probplot函数通过最小二乘法来估计一组数据的分位数对并利用线性回归技术求出分位数图上的理论值与实际值的直线方程。
stats.probplot(data, plotplt, distnorm, fitTrue, rvalueTrue)
plt.title(Probability Plot (Q-Q Plot))
plt.legend()
plt.grid(True)
plt.tight_layout()
# 显示图形
plt.show()
Shapiro-Wilk正态性检验统计量: 0.9782676696777344
Shapiro-Wilk正态性检验p值: 0.6254295110702515 绘制P-P图
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
plt.rcParams[font.sans-serif] [SimHei] # 防止中文标签乱码
plt.rcParams[axes.unicode_minus] False
# 生成一个示例数据集这里使用随机数据
np.random.seed(0)
data np.random.normal(loc50, scale5, size40) # 均值50标准差5
# 正态性检验 - Shapiro-Wilk检验
# Shapiro-Wilk检验基于W统计量对数据是否符合正态分布进行评估适用于各种样本大小
stat, p stats.shapiro(data)
print(Shapiro-Wilk正态性检验统计量:, stat)
print(Shapiro-Wilk正态性检验p值:, p)
plt.figure(figsize(6, 6))
# Create a P-P plot
stats.probplot(data, plotplt)
# Customize the plot if needed
plt.title(P-P Plot)
plt.xlabel(Theoretical Quantiles)
plt.ylabel(Sample Quantiles)
# Show the plot
plt.show()