当前位置:
首页 > Python基础教程 >
-
python基础教程之用Python学分析 - 单因素方差分析
判断控制变量是否对观测变量产生了显著影响
分析步骤
1. 建立检验假设
- H0:不同因子水平间的均值无差异
- H1:不同因子水平间的均值有显著差异
- 【注意】有差异,有可能是所有因子水平间都存在差异,也有可能只有两个因子水平间的均值存在差异
2. 计算检验统计量F值
F = MSA / MSE
MSA = SSA / ( k - 1 ) MSA:组间均方, 对总体方差的一个估计
MSE = SSE / ( n - k ) MSE:组内均方,不论H0是否为真,MSE都是总体方差的一个无偏估计
SST = SSA + SSE SST:总误差平方和,反映全部观测值的离散情况
SSA:组间误差平方和,也称水平项误差平方和,反映各因子水平(总体)的样本均值之间的差异程度
SSE: 组内误差平方和
3. 确定P值
4. 方差分析表
5. 根据给定的显著性水平,并作出决策
根据F值进行假设检验
根据选定的显著性水平,F值大于临界值时,将拒绝原假设
根据P值进行假设检验
6. 进一步分析
方差齐性检验
多重比较检验
- 确定控制变量的不同水平对观测变量的影响程度
- 哪个水平的作用明显区别于其他水平
- 哪个水平的作用是不显著
- 等等
【python分析:用ols模块进行计算】
1 # 引入数据 2 import pandas as pd 3 data_value = { '无促销':[23,19,17,26,28,23,24,30], 4 '被动促销':[26,22,20,30,36,28,30,32], 5 '主动促销':[30,23,25,32,48,40,41,46]}# 因变量 6 da = pd.DataFrame( data_value ).stack() 7 da.columns = ['水平','观测值'] 8 9 # ols模块进行分析 10 11 from statsmodels.formula.api import ols 12 from statsmodels.stats.anova import anova_lm 13 14 formula = '{} ~ {}'.format(da.columns[1], da.columns[0]) 15 model = ols( formula, da ).fit() 16 anovat = anova_lm(model) 17 print(anovat)
输出结果:
【python分析:用自定义函数进行计算】
View Code
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式