参考资料:R语言实战【第2版】
1、相关性
pwr.r.test()函数可以对相关性分析进行功效分析。格式如下:
pwr.r.test(n=, r=, sig.level=, power=, alternative=)
其中,n是观测数目,r是效应值(通过线性相关系数衡量),sig.level是显著性水平,power是功效水平,alternative指定显著性检验是双边检验("two.sided")还是单边检验("less"或"greater")。
假设正在研究抑郁与孤独的关系,我们的零假设和备择假设分别是:
H0:
HA:
其中,是两个心理变量的总体相关性大小。我们设定显著性水平为0.05,而如果H0是错误的,我们想有90%的信心拒绝H0,那么研究需要多少观测呢?代码如下:
# 加载pwr包
library(pwr)
# 相关性功效分析
pwr.r.test(r=0.25,sig.level = 0.05,power=0.9,alternative = "greater"
)
结果表明:我们需要134个受试者来评价抑郁与孤独的关系,以便在零假设为假的情况下有90%的信息拒绝它。
2、线性模型
多于线性模型(比如多元回归),pwr.f2.test()函数可以完成相应的功效分析,格式为:
pwr.f2.test(u=, v=, f2=, sig.level=, power=)
其中,u和v分别是分子自由度和分母自由度,f2是效应值。
其中,R^2=多重相关性的总体平方值
其中,=集合A中变量对总体方差的解释率;=集合A和B中变量对总体方差的解释率。
当要评价一组预测变量对结果的影响程度,适宜采用第一个公式来计算f2;当药评价一组预测变量对结果的影响超过第二组变量(协变量)多少时,适宜采用第二个公式。
现在假设我们想研究老板的领导风格对员工满意度的影响,是否超越薪水和工作小费对员工满意度的影响。领导风格可用四个变量来评估,薪水和小费与三个变量有关。过去的经验表明,薪水和消费能够解释约30%的员工满意度方差。从而现实出发,领导风格至少能解释35%的方差。假定显著性水平为0.05,那么在90%的置信度情况下,我们需要多少受试者才能得到这样的方差贡献率呢?
此处,sig.level=0.05,power=0.9,u=3(总预测变量数减去集合B中的预测变量数),效应值为f2=(0.35-0.30)/(1-0.35)=0.0769。
# 线性模型功效分析
pwr.f2.test(u=3,f2=0.0769,sig.level=0.05,power=0.9
)
在多元回归分析中,分母的自由度等于N-k-1,N是总观测数,k是观测变量数。本例中,N-7-1=185,即需要的样本大小为N=185+7+1=193。