怎么降低网站的跳出率,网站建设类论文格式,c 网站建设教程,php 企业建站cms一、单样本T检验 目的#xff1a;检验单样本的均值是否和已知总体的均值相等前提条件#xff1a; #xff08;1#xff09;总体方差未知#xff0c;否则就可以利用 Z ZZ 检验#xff08;也叫 U UU 检验#xff0c;就是正态检验#xff09;#xff1b; #xff08;2检验单样本的均值是否和已知总体的均值相等前提条件 1总体方差未知否则就可以利用 Z ZZ 检验也叫 U UU 检验就是正态检验 2正态数据或近似正态 3连续变量 原假设和备择假设 例子假设已知我国男青少年的平均身高是1.73那么取某高校50名男生的身高本文采用随机数据想比较该高校与我国男青少年的平均身高是否存在差异。 ttest_1samp 函数参数可参考
from scipy import statsrvs stats.norm.rvs(loc1.5, scale1, size(50)) # 生成均值为1.5标准差为1的50个样本
t, p stats.ttest_1samp(rvs, 1.73) # 进行单样本T检验print( T-test: %f\n%t,P-vlaue: %f%p)# T-test: -3.087647
# P-vlaue: 0.003317结论T值小于0说明样本均值小于总体均值P值小于0.05说明该高校与我国男青少年的平均身高存在差异。 单侧检验 scipy库中stats只提供了双侧检验如果需要单侧检验只需要将计算出来的P值除于2即可这里参考文章利用python进行单边T检验 置信区间采用 scipy.stats.norm.interval() 函数计算 import numpy as npstats.norm.interval(alpha 0.95,loc np.mean(rvs),scale stats.sem(rvs)
)二、独立样本t检验双样本T检验 目的检验两组独立样本均值是否相等前提条件 1两组总体方差相等如果不相等先利用levene检验检验两总体是否具有方差齐性 2正态数据或近似正态 3连续变量原假设和备择假设: 场景1 想比较可口可乐饮料在沃尔玛、大润发两个超市的销量是否存在差异场景2 想比较南、北方人的平均身高、体重是否存在差异 需要注意的是前期需要检验两组方差是否相等如不相等 scipy.stats.ttest_ind() 函数中的参数 equal_var 需要设置成 False levene 检验P值 0.05接受原假设认为两组方差相等 from scipy import statsrvs_1 stats.norm.rvs(loc1.5, scale1, size(50)) # 生成均值为1.5标准差为1的50个样本
rvs_2 stats.norm.rvs(loc2, scale1, size(50)) # 生成均值为2标准差为1的50个样本levene stats.levene(rvs_1, rvs_2) # 进行 levene 检验t, p stats.ttest_ind(rvs_1,rvs_2,equal_varTrue) # 独立样本t检验print(levene 检验P值: %f%levene.pvalue,\n)print(独立样本t检验)
print( T-test: %f\n%t,P-vlaue: %f%p)T值小于0说明第一组数据的均值小于第二组 单侧检验同上 三、配对样本T检验 目的比较同一组样本在不同场景下均值是否存在差异前提条件 1两组总体方差相等如果不相等先利用levene检验检验两总体是否具有方差齐性 2正态数据或近似正态 3连续变量原假设和备择假设 场景1 将小白鼠配对为两组分别接受不同的处理检验处理结果的差异场景2 对于一批血清样本将其分为两个部分利用不同的方法接受某种化合物的检验检验结果的差异场景3 检验癌症患者术前、术后的某种指标的差异场景4 可口可乐饮料今年与去年在沃尔玛超市销售额均值是否存在差异 与独立样本t检验相比配对样本T检验要求样本是配对的两个样本的样本量要相同 python 实现有两种方式 1两组数据做差再对差值进行单样本T检验检验均值为0; 2利用 scipy.stats.ttest_rel() 函数进行配对样本T检验 from scipy import statsrvs_1 stats.norm.rvs(loc1.5, scale1, size(50)) # 生成均值为1.5标准差为1的50个样本
rvs_2 stats.norm.rvs(loc2, scale1, size(50)) # 生成均值为2标准差为1的50个样本levene stats.levene(rvs_1, rvs_2) # 进行 levene 检验
t1, p1 stats.ttest_1samp(rvs_1 - rvs_2, 0) # 单样本T检验
t2, p2 stats.ttest_rel(rvs_1,rvs_2) # 配对样本t检验print(levene 检验P值: %f%levene.pvalue,\n)print(单样本T检验)
print( T-test: %f\n%t1,P-vlaue: %f%p1)print(\n配对样本t检验)
print( T-test: %f\n%t2,P-vlaue: %f%p2)