Rによる分散分析など
Rでグループを比較する手法のメモです.
目次
t検定
帰無仮説として母平均mu=0を検定するには,
t.test(ベクトル, mu=0) |
とします.
オプションalternave="greater"
もしくはalternave="less"
で片側検定となります.
90%信頼区間を設定するには,オプションでconf.level = 0.9
とします.
独立な2群のt検定
t.test(グループ1のベクトル, グループ2のベクトル, var.equal=T) |
オプションでvar.equal=F
とすれば,Welchの検定になります.
xがセグメントであるとき,formula式から指定することもできます.
t.test(y ~ x) |
対応のあるt検定
t.test(グループ1のベクトル, グループ2のベクトル, paired=T) |
分散の等質性の検定
var.test(グループ1のベクトル, グループ2のベクトル) |
カイ二乗検定
グループ間に違いがあるかを調べるには
chisq.test(表) |
を使います.
クロス集計表の独立性検定のため,連続性に関するイェーツ補正を行わないようにしたいなら,オプションでcorrect=FALSE
とします.
比率検定
60%の確率で表が出るコインを使って20回のコイン投げを行うとしましょう.
10回表が出るという確率を検定するには,
binom.test(10, 20, p=0.6) |
とします.
分散分析
3つ以上の群で平均値の差を検定するときの方法です.
一元配置分散分析
分散分析表はanova
で表示します.
anova(lm(y~x)) |
変数t
に関して対応づけが見られるなら
anova(lm(y~x+t)) |
です.
一元配置分散分析の専用の関数として,oneway.test()
があります.
oneway.test(y~x) |
分散が等質なら,オプションでvar.equal=T
とします.
序数による場合は,クラスカル・ウォリス検定
kruskal.test(y~x) |
を用います.
テューキーの多重比較(2群ごとの比較)を行う場合は,
TukeyHSD(aov(y~x)) |
とします.
二元配置分散分析
変数t
について2要因対応付けがあるなら,
anova(lm(z~x*y + Error(t + t:x + t:y + t:x*y))) |
です.
1要因なら
anova(lm(z~x*y + Error(t:x + t:x*y))) |
となります.
summary(aov(formula式))
という書き方もあります.(処理は若干異なります.)
参考文献
Rによる統計学の入門書です.
- 山田剛史ら (2008)「Rによるやさしい統計学」オーム社.
言葉で理論を簡潔に紹介しながら,手を動かしてマーケティングリサーチを学んでいくスタイルの実践的な書籍です.
- Chris Chapman and Elea McDonnell Feit 著,鳥居弘志 訳 (2020)「Rによる実践的マーケティングリサーチと分析」2版,共立出版.(Chris Chapman and Elea McDonnell Feit (2019) “R for Marketing Research and Analytics”, 2nd ed., Springer)