VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > Python基础教程 >
  • python基础教程之用Python学分析 - 单因素方差分析

判断控制变量是否对观测变量产生了显著影响

分析步骤

1. 建立检验假设

   - H0:不同因子水平间的均值无差异
  - H1:不同因子水平间的均值有显著差异
  - 【注意】有差异,有可能是所有因子水平间都存在差异,也有可能只有两个因子水平间的均值存在差异

2. 计算检验统计量F值

  F = MSA / MSE
  MSA = SSA / ( k - 1 )    MSA:组间均方, 对总体方差的一个估计
  MSE = SSE / ( n - k )    MSE:组内均方,不论H0是否为真,MSE都是总体方差的一个无偏估计
  SST = SSA + SSE        SST:总误差平方和,反映全部观测值的离散情况 
       SSA:组间误差平方和,也称水平项误差平方和,反映各因子水平(总体)的样本均值之间的差异程度
       SSE: 组内误差平方和

3. 确定P值

4. 方差分析表

5. 根据给定的显著性水平,并作出决策

  根据F值进行假设检验
  根据选定的显著性水平,F值大于临界值时,将拒绝原假设
  根据P值进行假设检验

 6. 进一步分析

     方差齐性检验

     多重比较检验

  - 确定控制变量的不同水平对观测变量的影响程度
  - 哪个水平的作用明显区别于其他水平
  - 哪个水平的作用是不显著
  - 等等

【python分析:用ols模块进行计算】

复制代码
 1 # 引入数据
 2 import pandas as pd
 3 data_value = { '无促销':[23,19,17,26,28,23,24,30],
 4               '被动促销':[26,22,20,30,36,28,30,32],
 5               '主动促销':[30,23,25,32,48,40,41,46]}# 因变量
 6 da = pd.DataFrame( data_value ).stack()
 7 da.columns = ['水平','观测值']
 8 
 9 # ols模块进行分析
10 
11 from statsmodels.formula.api import ols
12 from statsmodels.stats.anova import anova_lm 
13 
14 formula = '{} ~ {}'.format(da.columns[1], da.columns[0])
15 model = ols( formula, da ).fit()
16 anovat = anova_lm(model)
17 print(anovat)
复制代码

输出结果:

【python分析:用自定义函数进行计算】

 View Code


相关教程