Rでグループを比較する手法のメモです.

目次

  1. t検定
    1. 独立な2群のt検定
    2. 対応のあるt検定
  2. 分散の等質性の検定
  3. カイ二乗検定
  4. 比率検定
  5. 分散分析
    1. 一元配置分散分析
    2. 二元配置分散分析
  6. 参考文献

t検定

帰無仮説として母平均mu=0を検定するには,

t.test(ベクトル, mu=0)

とします.

オプションalternave="greater"もしくはalternave="less"で片側検定となります.
90%信頼区間を設定するには,オプションでconf.level = 0.9とします.

独立な2群のt検定

t.test(グループ1のベクトル, グループ2のベクトル, var.equal=T)

オプションでvar.equal=Fとすれば,Welchの検定になります.

xがセグメントであるとき,formula式から指定することもできます.

t.test(y ~ x)

対応のあるt検定

t.test(グループ1のベクトル, グループ2のベクトル, paired=T)

分散の等質性の検定

var.test(グループ1のベクトル, グループ2のベクトル)

カイ二乗検定

グループ間に違いがあるかを調べるには

chisq.test()

を使います.

クロス集計表の独立性検定のため,連続性に関するイェーツ補正を行わないようにしたいなら,オプションでcorrect=FALSEとします.

比率検定

60%の確率で表が出るコインを使って20回のコイン投げを行うとしましょう.
10回表が出るという確率を検定するには,

binom.test(10, 20, p=0.6)

とします.

分散分析

3つ以上の群で平均値の差を検定するときの方法です.

一元配置分散分析

分散分析表はanovaで表示します.

anova(lm(y~x))

変数tに関して対応づけが見られるなら

anova(lm(y~x+t))

です.

一元配置分散分析の専用の関数として,oneway.test()があります.

oneway.test(y~x)

分散が等質なら,オプションでvar.equal=Tとします.

序数による場合は,クラスカル・ウォリス検定

kruskal.test(y~x)

を用います.

テューキーの多重比較(2群ごとの比較)を行う場合は,

TukeyHSD(aov(y~x))

とします.

二元配置分散分析

変数tについて2要因対応付けがあるなら,

anova(lm(z~x*y + Error(t + t:x + t:y + t:x*y)))

です.
1要因なら

anova(lm(z~x*y + Error(t:x + t:x*y)))

となります.

summary(aov(formula式))という書き方もあります.(処理は若干異なります.)

参考文献

Rによる統計学の入門書です.

  • 山田剛史ら (2008)「Rによるやさしい統計学」オーム社.

言葉で理論を簡潔に紹介しながら,手を動かしてマーケティングリサーチを学んでいくスタイルの実践的な書籍です.

  • Chris Chapman and Elea McDonnell Feit 著,鳥居弘志 訳 (2020)「Rによる実践的マーケティングリサーチと分析」2版,共立出版.(Chris Chapman and Elea McDonnell Feit (2019) “R for Marketing Research and Analytics”, 2nd ed., Springer)