3개의 모집단을 비교하고자 할때 분산분석 방법을 알지 못한다면 두 독립집단끼리의 비교를 하는 t검정을 세번 실시해야 할 것이다.
세 집단 이상 비교를 가능하게 하기 위해서는 집단간 변화량 과 집단내 변화량을 비교하는 방법으로 피셔에 의하여 제안된 분산분석 방법을 사용해야 한다. 이는 F분포에 의하여 검정된다.
분산분석 : 분산의 원인이 어디에 있는가를 알아보는 통계적 방법이다. 동일한 세개의 집단에 각기 다른 처치를 가하여 각 집단마다 다른 결과가 나왔을 때 집단간의 차이에 따른 분산이 있을 수 있고, 집단 내에서 피험자간의 분산이 발생할 수 있다.
종속변수의 총 변화량은 처치에 의한 집단간 변화량과 집단 내에서의 개인차인 집단내 변화량으로 양분됨.
F= 집단간 분산 / 집단내 분산
집단내 분산에 비추어 집단간 분산의 비율을 계산하여 결론을 유도함.
F값이 F분포에 의한 기각값보다 클 때 집단간의 유의한 차이가 있다고 결론을 냄.
F분포는 두 종류의 분산비율에 의한 분포이다.
독립적인 카이 스퀘어 변수들이 해당되는 자유도에 의하여 나눠진 값의 비율에 의한 분포를 말함. 카에 스퀘어 변수들은 제곱값이어서 항상 양수이기 때문에 F값 역시 양수가 된다. 자유도가 무한히 커지지 않는한 정적 편포를 나타냄. 가족분포로… 분자와 분모의 분산추정에 따른 자유도와 유의수준에 의하여 F값이 있음.
분산분석을 위한 기본가정
1. 종속변수가 양적변수
2. 각 집단에 해당되는 모집단의 분포가 정규분포
3. 각 집단에 해동되는 모집단들의 분산이 같아야한다.
등분산가정 검정 방법 = F값 계산.. F값이 1에 가까우면 두 모집단의 분산은 다르지 않다는 것. 매우 크거나 0에 가까우면 분산이 다른 것.
일원분산분석 : 독립변수가 하나 일때 분산의 원인이 집단간 차이에 기인한 것인지를 분석하는 통계적 방법. 각 독립변수의 수준은 세개 이상.
개인의 점수는 평균점수, 집단효과, 오차점수로 합성됨.
각 피험자의 총편차 = 집단간 편차 + 집단내 편차
총편차 제곱합 SSt= 집단간 편차 제곱합 SSb + 집단내 SSw
SSb / J-1 = MSb (집단간 차이에 의한 분산)
SSw / N-J = MSw (집단내 차이에 의한 분산) = 통합분산 두 독립표본 t검정을 할때 등분산 가정하에서 모집단의 분산을 추정하기 위해 두 표본으로부터 얻은 분산을 통합하여 계산하는 것과 동일함
F = MSb/ MSw
끝.
F값 성질 : 음수가 될수 없어. 1이하인 경우는 드물어. F통계값의 기대값은 집단내 자유도를 집단내 자유도에서 2를 뺀수로 나눈 값이어서 1에 가깝다. 그러나 일반적으로 집단간 분산이 집단내 분산보다 크다.
집단간 자유도, 집단내 자유도, 유의수준에 의하여 결정됨.
에타제곱 = 총편차 제곱합 중에 집단간 차이, 부분이 얼마나 되는지 알려줘. SSb/SSt
계산공식
집단간 편차제곱합 = 각 집단안에 있는 변수의 합을 제곱하여 각 집단의 사례수로 나눈뒤 다 더해. – 전체사례의 총합을 제곱 / 전체사례수
집단 내 편차제곱합 = 각 점수를 제곱한뒤 모두 더해 – (각 집단의 합의 제곱을 각 집단의 사례수로 나누고 이걸 다 더해)
총편차제곱합 = 각 점수를 제곱한 뒤 모두 더해 – 전체사례의 총합을 제곱 / 전체사례수
일원분산분석에서 영가설이 기각되었다면 , 비교집단들의 모집단의 평균이 차이가 있음을 말한다.
그런데 어느 집단과 어느 집단이 차이가 있는지를 말하지는 않아. 여러 모집단 평균들과의 많은 대비중 최소한 하나 이상의 대비가 통계적으로 0이 아니라는 얘기.
사후비교분석 : scheffe 방법 , 사후비교를 위한 scheffe 방법
영가설의 기각여부를 검정하여 만약 영가설이 기각되었다면 어떤 대비에서 차이가 나타나는지를 찾아내는 통계적 방법
고정된 유의수준에서 영가설이 기각되었다는 사실은 고정된 유의수준을 비교가능한 모든 대비가 분할하여 소유하고 있기 때문에 각 대비마다 해당되는 유의수준 a를 가능한 모든 대비수로 나누게 된다.
두 집단비교를 위한 t검정과 같은 원리라서 기각값도 F값의 제곱근이 되어야한다.
대비에 의한 t통계값 계산.
짝비교 : 한 집단과 다른 집단을 간단히 비교하는 방법 : 전통적 교수법 , 시청각 교수법
복합비교 : 어떤 집단과 다른 여러개의 집단을 합성하여 비교하는 법.
대비계수가 n에 따라 달라짐.
연구에 대한 이론적 배경이 강하지 않을 때 집단간 차이가 있는지 여부를 일차검정 후 차이가 있는 대비를 찾아내는 방법. 영가설이 기각되지 않으면 실시할 수 없어.
사후비교분석의 결점 : 연구의 관심대상이 되지 않은 모든 대비도 유의수준을 공유해ㅎ야한는 결점이 있어. (기각값을 찾을때 유의수준을 가능한 모든 대비로 나눠야해)
사전비교분석 : 전체 가설을 검정하지 않고 연구자가 관심있는 대비만을 가지고 통계적 검정을 실시.
F통계값을 계산할 ㅣㄹ요가 없어. 두개만 가지고 하면 .05/2 가 F값
유의수준을 대비수로 나눈값에 대한 t분포에 의한 기각값을 찾으면 됨.
사전비교분석의 기각값인 t값을 찾을때 자유도는 MSw에 해당되는 자유도.
사전비교분석의 기각값의 절대값이 사후비교분석보다 작아. 더 강력해. 검정력이 강해.
분산분석표 : F통계값 적는 것 유무.
대비에 해당되는 제곱합을 계산하는 방법 ㅗ.
분산분석을 통한 F통계값은 두 독립표본 t검정을 통한 t통ㅖ값의 제곱값과 같음.
t통계값은 F통계값의 제곱근과 같음.