学生意識調査 2008

友人・恋愛関係

菅野剛 研究室

1. 調査概要

表1: 学生意識調査2008 nu08
項目 内容
調査テーマ 友人・恋愛関係
実施時期 2008年
対象 母集団が不明
  主に、たまたま協力が得られた学生・桜麗祭来場者
調査方法 質問紙法・自記式調査法
標本サイズ n=610
環境 R
memo 学生意識調査と郵送地域調査の同時並行で連日終電泊まり込み

2. データ構造

nu08-info-reveal-R-ggpairs-01.png

図1: 学生意識調査2008 nu08

3. 比率の差の検定 1

1.5 Comparing two independent proportions | Inferential Statistics | Comparing two groups | UvA

仮定

  • 独立(無作為割当か、無作為抽出)
  • 十分なサンプルサイズ
    • 片側検定:最低でも、セルに10以上
    • 両側検定:最低でも、セルに5以上

仮説

  • 帰無仮説:母比率に差がない
    • \(H_0: \pi_1 - \pi_2 = 0\)
  • 対立仮説:母比率に差がある
    • \(H_a: \pi_1 - \pi_2 \neq 0\)

4. 比率の差の検定 2

\begin{equation*} \mbox{検定統計量}\ z = \frac{\mbox{標本比率の差} - \mbox{母比率の差}}{\mbox{差の標準誤差}} \end{equation*}

帰無仮説においては母比率に差がないので、母比率の差 = 0

\begin{eqnarray*} \mbox{検定統計量}\ z &=& \frac{\mbox{標本比率の差} - 0}{\mbox{差の標準誤差}}\\ &=& \frac{\mbox{標本比率の差}}{\mbox{差の標準誤差}} \end{eqnarray*}

5. 比率の差の検定 3

以上を数式で表すと…

\begin{eqnarray*} z &=& \frac{(\hat{p}_1 - \hat{p}_2) - (\pi_1 - \pi_2)}{se_0}\\ &=& \frac{\hat{p}_1 - \hat{p}_2}{se_0} \end{eqnarray*}

6. 比率の差の検定 4

分母に含まれる \(se_0\) (差の標準誤差)は

\begin{equation*} se_0 = \sqrt{\hat{p} (1-\hat{p}) (\frac{1}{n_1} + \frac{1}{n_2}) } \end{equation*}

上式中の \(\hat{p}\) (プールした比率)は

\begin{equation*} \hat{p} = \frac{n_1 \hat{p}_1 + n_2 \hat{p}_2}{n_1 + n_2} \end{equation*}
  • ※ Inferential Statistics 1.05 Two independent proportions 動画の \(\hat{p}\) の分子の - は間違い、 + が正しい

7. 比率の差の検定 5

まとめると

\begin{eqnarray*} \mbox{検定統計量}\ z &=& \frac{\hat{p}_1 - \hat{p}_2}{se_0}\\ \mbox{差の標準誤差}\ se_0 &=& \sqrt{\hat{p} (1-\hat{p}) (\frac{1}{n_1} + \frac{1}{n_2}) }\\ \mbox{プールされた比率}\ \hat{p} &=& \frac{n_1 \hat{p}_1 + n_2 \hat{p}_2}{n_1 + n_2} \end{eqnarray*}
  • ※ Inferential Statistics 1.05 Two independent proportions 動画の \(\hat{p}\) の分子の - は間違い、 + が正しい

8. 比率の差の検定 6

  • (53) 交際相手には何を求めますか(複数回答可)
    1. 包容力
    2. 優しさ
    3. 外見・スタイル
    4. 経済力
    5. 自分のことをどれ位好きでいてくれるか
    6. 趣味が合う
    7. 会話が楽しい
    8. その他(        )

9. 比率の差の検定 7

学生意識調査での具体例

  • 交際相手に 包容力 を求める比率に、男女差があるか

仮説

  • 帰無仮説:相手に 包容力 を求める母比率に、男女差はない
    • \(H_0: \pi_1 - \pi_2 = 0\)
  • 対立仮説:相手に 包容力 を求める母比率に、男女差がある
    • \(H_a: \pi_1 - \pi_2 \neq 0\)

10. 比率の差の検定 8

性別×交際相手に包容力を求める

  交際相手に包容力を求める 非選択(特に求めない) Sum
91 216 307
188 115 303

11. 比率の差の検定 9

  • 調査の結果、相手に 包容力 を求める標本比率には、男女差がありそう
  • だが、どのくらいの差があれば、母比率でも男女差があると思ってよいのか、わからない

nu08-info-reveal-R-mosaicplot-a1-a311.png

図2: 性別 × 交際相手に包容力を求める (n=609)

12. 比率の差の検定 10

表2: 性別×交際相手に包容力を求める
  交際相手に包容力を求める 非選択(特に求めない) 合計
91 216 307
188 115 303
\begin{eqnarray*} \hat{p}_1 &=& 91 \div (91 + 216) \fallingdotseq 0.3\\ \hat{p}_2 &=& 188 \div (18 + 115) \fallingdotseq 0.62 \end{eqnarray*}
表3: 性別×交際相手に包容力を求める
  交際相手に包容力を求める 非選択(特に求めない) 合計
\(\hat{p}_1 = 0.3\) 0.7 1
\(\hat{p}_2 = 0.62\) 0.38 1

13. 比率の差の検定 11

表4: 性別×交際相手に包容力を求める
  交際相手に包容力を求める 非選択(特に求めない) 合計
91 216 \(n_1 = 307\)
188 115 \(n_2 = 303\)
合計 279 331 610
\begin{eqnarray*} \mbox{プールされた比率} \hat{p} &=& (91 + 188) \div (91 + 216 + 188 + 115)\\ &=& 279 \div 610\\ &\fallingdotseq& 0.46 \end{eqnarray*}

14. 比率の差の検定 12

\begin{eqnarray*} \mbox{プールされた比率}\ \hat{p} &=& \frac{n_1 \hat{p}_1 + n_2 \hat{p}_2}{n_1 + n_2} \fallingdotseq 0.46\\ \mbox{標準誤差}\ se_0 &=& \sqrt{\hat{p} (1-\hat{p}) (\frac{1}{n_1} + \frac{1}{n_2}) }\\ &=& \sqrt{0.46 \times (1-0.46) (\frac{1}{307} + \frac{1}{303}) }\\ &\fallingdotseq& \sqrt{0.2484 \times 0.00655}\\ &\fallingdotseq& \sqrt{0.0016} \fallingdotseq 0.04\\ \mbox{検定統計量}\ z &=& \frac{\hat{p}_1 - \hat{p}_2}{se_0} \fallingdotseq \frac{0.3 - 0.62}{0.04} \fallingdotseq -8 \end{eqnarray*}

15. 比率の差の検定 13

\begin{equation*} \mbox{検定統計量}\ z = \frac{\hat{p}_1 - \hat{p}_2}{se_0} \fallingdotseq \frac{0.3 - 0.62}{0.04} \fallingdotseq -8 \end{equation*}
  • 帰無仮説( 包容力 を求める比率に男女差がない)のもとでは 得られた z=-8 以下の確率は非常に小さい(標準正規分布表より)
  • 手元の結果を受け入れ、前提としていた帰無仮説を疑うべき
  • 帰無仮説を棄却する

結論

  • 交際相手に 包容力 を求める比率には男女差があり、男性に比べ、女性の方が有意に高い

16. 比率の差の検定 14

交際相手に 優しさ を求める比率に、男女差があるか

仮説

  • 帰無仮説:相手に 優しさ を求める母比率に、男女差はない
    • \(H_0: \pi_1 - \pi_2 = 0\)
  • 対立仮説:相手に 優しさ を求める母比率に、男女差がある
    • \(H_a: \pi_1 - \pi_2 \neq 0\)

17. 比率の差の検定 15

性別×交際相手に 優しさ を求める

  交際相手に優しさを求める 非選択(特に求めない) Sum
193 114 307
241 62 303

18. 比率の差の検定 16

  • 調査の結果、相手に 優しさ を求める標本比率には、男女差がありそう
  • だが、どのくらいの差があれば、母比率でも男女差があると思ってよいのか、わからない

nu08-info-reveal-R-mosaicplot-a1-a312.png

図3: 性別 × 交際相手に優しさを求める (n=610)

19. 比率の差の検定 17

同様に、二群の比率の検定をやってみよう

\begin{eqnarray*} \mbox{プールされた比率}\ \hat{p} &=& \frac{n_1 \hat{p}_1 + n_2 \hat{p}_2}{n_1 + n_2}\\ \mbox{標準誤差}\ se_0 &=& \sqrt{\hat{p} (1-\hat{p}) (\frac{1}{n_1} + \frac{1}{n_2}) }\\ \mbox{検定統計量}\ z &=& \frac{\hat{p}_1 - \hat{p}_2}{se_0} \end{eqnarray*}

20. 比率の差の検定 18

交際相手に 経済力 を求める比率に、男女差があるか

仮説

  • 帰無仮説:相手に 経済力 を求める母比率に、男女差はない
    • \(H_0: \pi_1 - \pi_2 = 0\)
  • 対立仮説:相手に 経済力 を求める母比率に、男女差がある
    • \(H_a: \pi_1 - \pi_2 \neq 0\)

21. 比率の差の検定 19

性別×交際相手に 経済力 を求める

  交際相手に経済力を求める 非選択(特に求めない) Sum
23 283 306
83 220 303

22. 比率の差の検定 20

  • 調査の結果、相手に 経済力 を求める標本比率には、男女差がありそう
  • だが、どのくらいの差があれば、母比率でも男女差があると思ってよいのか、わからない

nu08-info-reveal-R-mosaicplot-a1-a314.png

図4: 性別 × 交際相手に経済力を求める (n=609)

23. 比率の差の検定 21

同様に、二群の比率の検定がやってみよう

\begin{eqnarray*} \mbox{プールされた比率}\ \hat{p} &=& \frac{n_1 \hat{p}_1 + n_2 \hat{p}_2}{n_1 + n_2}\\ \mbox{標準誤差}\ se_0 &=& \sqrt{\hat{p} (1-\hat{p}) (\frac{1}{n_1} + \frac{1}{n_2}) }\\ \mbox{検定統計量}\ z &=& \frac{\hat{p}_1 - \hat{p}_2}{se_0} \end{eqnarray*}

24. 比率の差の検定 22

ファインディングス

  • 男性に比べ、 女性の方が、包容力、経済力、優しさを交際相手に求める らしい
  • 注:データは、確率標本抽出でも無作為割当でもなく、あくまでも演習用教材のデータです

25. 平均の差の検定 1

1.6 Comparing two independent means | Inferential Statistics | Comparing two groups | UvA

t検定の前提

  • 独立(無作為割当か、無作為抽出)
  • 正規性
    • 大標本の場合は中心極限定理により頑健
    • 小標本、片側検定の場合は正規性が重要

仮説

  • 帰無仮説:母平均に、男女差はない
    • \(H_0: \mu_1 - \mu_2 = 0\)
  • 対立仮説:母平均に、男女差がある
    • \(H_a: \mu_1 - \mu_2 \neq 0\)

26. 平均の差の検定 2

学生意識調査での具体例

  • 新聞閲覧時間には、男女差があるか

仮説

  • 帰無仮説:新聞閲覧時間の母平均に、男女差はない
    • \(H_0: \mu_1 - \mu_2 = 0\)
  • 対立仮説:新聞閲覧時間の母平均に、男女差がある
    • \(H_a: \mu_1 - \mu_2 \neq 0\)

27. 平均の差の検定 3

\begin{eqnarray*} \mbox{検定統計量}\ t &=& \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2})}}\\ &=& \frac{ \bar{x}_1 - \bar{x}_2 }{\sqrt{(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2})}} \end{eqnarray*}
\begin{equation*} \mbox{自由度}\ df = \frac{ (\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2})^2 }{\frac{1}{n_1-1}(\frac{s_1^2}{n_1})^2 + \frac{1}{n_2-1}(\frac{s_2^2}{n_2})^2} \end{equation*}

この式を暗記する必要はない

28. 平均の差の検定 4

  • 男性 \(n_1 = 307\)
    • 新聞閲覧時間の標本平均 男性 \(\bar{x}_1 = 7.2\)
    • 新聞閲覧時間の不偏分散 男性 \(s_1^2 = 81.4\)
  • 女性 \(n_2 = 303\)
    • 新聞閲覧時間の標本平均 女性 \(\bar{x}_2 = 4.8\)
    • 新聞閲覧時間の不偏分散 女性 \(s_2^2 = 55.9\)
\begin{eqnarray*} \mbox{検定統計量}\ t &=& \frac{ \bar{x}_1 - \bar{x}_2 }{\sqrt{(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2})}} = \frac{ 7.2 - 4.8 }{\sqrt{(\frac{81.4}{307} + \frac{55.9}{303})}}\\ &\fallingdotseq& \frac{ 2.4 }{\sqrt{(0.266 + 0.184)}} \fallingdotseq \frac{ 2.4 }{\sqrt{0.45}} \fallingdotseq \frac{ 2.4 }{0.671}\\ &\fallingdotseq& 3.58 \end{eqnarray*}

29. 平均の差の検定 5

  • 男性 \(n_1 = 307\)
    • 新聞閲覧時間の標本平均 男性 \(\bar{x}_1 = 7.2\)
    • 新聞閲覧時間の不偏分散 男性 \(s_1^2 = 81.4\)
  • 女性 \(n_2 = 303\)
    • 新聞閲覧時間の標本平均 女性 \(\bar{x}_2 = 4.8\)
    • 新聞閲覧時間の不偏分散 女性 \(s_2^2 = 55.9\)
\begin{eqnarray*} \mbox{自由度}\ df &=& \frac{ (\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2})^2 }{\frac{1}{n_1-1}(\frac{s_1^2}{n_1})^2 + \frac{1}{n_2-1}(\frac{s_2^2}{n_2})^2}\\ &=& \frac{ (\frac{81.4}{307} + \frac{55.9}{303})^2 }{\frac{1}{307-1}(\frac{81.4}{307})^2 + \frac{1}{303-1}(\frac{55.9}{303})^2}\\ &\fallingdotseq& 590 \end{eqnarray*}

30. 平均の差の検定 6

\begin{eqnarray*} \mbox{検定統計量}\ t &\fallingdotseq& 3.58\\ \mbox{自由度}\ df &\fallingdotseq& 590 \end{eqnarray*}
  • t分布表で確認すると、自由度 590ではほぼ標準正規分布であり、高度に有意
  • 新聞閲覧時間に男女差はないという帰無仮説のもとで、奇跡的な結果が得られた
  • 手元の結果を受け入れ、帰無仮説を棄却
  • 新聞閲覧時間に男女差がないとは言えない → 差がありそう

31. 対応のある比率の差の検定

1.7 Comparing two dependent proportions | Inferential Statistics | Comparing two groups | UvA

  • nu08 データは対応のあるデータではない
    • 試験の前後や、選挙の前後など、同じ人に2度測定
  • nu08 データでは、対応のある比率の差の検定を試せない

32. 対応のある平均の差の検定

1.8 Comparing two dependent means | Inferential Statistics | Comparing two groups | UvA

  • nu08 データは対応のあるデータではない
    • 試験の前後や、選挙の前後など、同じ人に2度測定
  • nu08 データでは、対応のある平均の差の検定を試せない

33. under construction

  • under construction