■ 二つのグループの平均値が違うかどうかの検定
エクセルでは、分析ツールを使うことにより、簡単に「二つのグループの平均値が違うかどうかの検定」を行なうことができます。この検定をt検定と呼びます。
■ F検定
t検定を行なう前にF検定という検定を行ないましょう。t検定では、二つのグループの分散(偏差を二乗したものの合計)が等しい場合と等しくない場合の二つに場合分けをして検定を行なう必要があります。このため、事前準備としてまず二つのグループの分散が等しいかどうかの検定:F検定を行ないます。
二つのグループの分散が等しいとは、ばらつきが等しいということです。今回の例で言うと、A面の強度のばらつき具合と、B面の強度のばらつき具合が等しいと言っていいのかどうか。これを検証するのがF検定です。
■ F検定の実施
エクセルを使えば、F検定を簡単に行なうことができます。分析ツールを組み込んで、メニューバーのツールから「分析ツール」を選び、「F検定」を選べばOKです。
変数の範囲を選ぶ画面になりますので、それぞれのグループのデータ範囲を指定してやります。このときに、後で計算される「分散比」が1より大きな数字になるように、範囲を選ぶことがポイントです。1よりも小さい数字が計算された場合には、変数1の範囲指定と変数2の範囲指定を逆にしましょう。今回は、変数2の方に面Aのデータを入れる必要があります。
■ 危険率
次に、アルファの値を入力する必要がありますが、これは危険率または有意水準と呼ばれます。検定を行なう際には、まず仮説というものを設定します。エクセルのF検定で設定される仮説は、「グループ1とグループ2の分散(ばらつき)が等しい」という仮説です。
危険率アルファとは、この仮説を捨て去るときに、結論が誤っている確率です。例えば、危険率5%と言えば、「グループ1とグループ2の分散は等しい」という仮説を棄却したとき、誤っている確率はたかだか5%であるということになります。
危険率の値は、どの程度誤る確率を許すのかによって変える必要があります。ふつうは5%と考えておけばよいでしょう。厳しく見積もる必要がある場合は1%、命に関わるケースではもっとずっと小さい値を使用しているはずです。
■ 帰無仮説
設定する仮説のことを帰無仮説と呼びます。本当は、仮説は棄却されることを目的として設定する必要があります。というのも、この仮説が棄却されなかった場合は、棄却されなかったというだけのことであって、その仮説を100%支持するという理由にはならないからです。
「グループ1とグループ2のばらつきが等しい」という仮説を採択した場合にも、誤っている確率は0ではない、ということに気をつけなければいけません。
仮説を棄却した時に誤る確率を、第1種の誤り確率(α)、仮説を採択した時に誤る確率を第2種の誤り確率(β)と呼びます。第1種の誤り確率αのことを危険率や有意水準と呼び、「有意水準5%で検定を行なう」のように使われます。また、1−βを検出力と呼びます。検出力は、仮説が正しくない時にきちんとこれを棄却する確率となります。
■ F検定の結果の見方
| F-検定: 2標本を使った分散の検定 | ||
| A面 | B面 | |
| 平均 | 35.7 | 35.9 |
| 分散 | 3.57 | 2.32 |
| 観測数 | 10 | 10 |
| 自由度 | 9 | 9 |
| 観測された分散比 | 1.53 | |
| 両側 | 0.27 | |
| F 境界値 両側 | 4.03 |
検定を行なうと、いくつかの統計量が計算されます。まず、観測された分散比という値に注目しましょう。これはF0とも呼ばれます。次に、F境界値両側というところをみましょう。
観測された分散比:F0>F境界値両側であれば、仮説は危険率アルファで棄却されることになります。
今回の検定では、危険率を5%とした場合、F0=1.53に対し、F境界値両側=4.03ですから、F0<F境界値両側となり、仮説を棄却することができません。
すなわち、「グループ1とグループ2のばらつきは等しい」という仮説を捨て去ることはできませんでした。前にも述べたとおり、本来はこれで仮説が100%裏付けられたということは全く無いのですが、実用上はこれをもって二つのグループのばらつきには差がない、と結論してしまいます。正確には先ほど述べた第2種の誤り確率を計算で求める必要がありますが、ここでは割愛します。
■ t検定
次に、t検定を行ないましょう。F検定同様に、メニューバーのツールから「分析ツール」を選び、「t検定:等分散を仮定した2標本による検定」を選びます。あとはF検定同様にデータ範囲と危険率を入れます。そして平均の差をどの程度と仮定するか値を入れます。ここでは0を入れるか、値を入力しないと0として扱われます。
■ t検定の結果の見方
| A面 | B面 | |
| 平均 | 35.9 | 35.7 |
| 分散 | 2.32 | 3.57 |
| 観測数 | 10 | 10 |
| プールされた分散 | 2.94 | |
| 仮説平均との差異 | 0 | |
| 自由度 | 18 | |
| t | 0.26 | |
| P(T<=t) 片側 | 0.40 | |
| t 境界値 片側 | 1.73 | |
| P(T<=t) 両側 | 0.80 | |
| t 境界値 両側 | 2.10 |
まず、tの値を見ましょう。次に、t境界値両側というところを見ます。t>t境界値両側である場合には、仮説「グループ1の平均値とグループ2の平均値の差が0」が危険率5%で棄却されます。
結果は、危険率5%のとき、t=0.26、t境界値両側=2.10ですから、t<t境界値両側となり、仮説は棄却されませんでした。ここでも、本当は100%仮説を支持できるわけではありませんが、実用上は通常、平均に差がないという結論を導いてしまいます。
■ 結論
F検定およびt検定の結果は、A面とB面の強度の値について、平均値、ばらつきのいずれについても、差がないものと判断できる、という結論が導かれました。
今回の場合について分かりやすい言葉で言い換えれば、「A面のコンクリートも、B面のコンクリートも、同じ強度分布をもった材料から作られている」という結論となります。