5월 032008
 



카이자승 분포 : 표준정규분포로부터 만들어진다. 카이자승 분포는 자유도의 형태에 의해 규명되는 가족분포의 한 종류. 자유도가 무한대로 증가하면 정규분포, 일반적으로 정적편포



Z분포의 표준점수를 제곱하여 만들어진 분포이다. 즉 카이자승 분포는 평균이 뮤y이고 분산이 시그마y제곱인 모집단분포에서 사례 수가 n인 표본을 추출하였을 때 각 사례의 표준점수를 제곱한 후 더하여 만들어진 분포



– 자유도가 1일 경우 카이자승 분포는 Z분포의 제곱과 같다. Z분포의 분산은 1이므로 카이자승의 평균은 1이 된다. 자유도가 1일 때 카이자승의 분산은 2이다.



J의 자유도를 가진 카이자승분포의 평균은 J이다. 분산은 2J .자유도가 nu 이면 v, 2v



카이자승 분포 기본가정


– 종속변수가 명명척도에 의한 질적변수이거나 최소한 범주변수 이어야 한다. ex ) 성별, 인종, 자동차 유형, 우수아 보통아, 저능아,


– 각 범주에 포함되어있는 도수, 획득도수 또는 획득빈도가 있어야한다. 각 범주에 포함될 수 있는 기대되는 도수는 기대도수 혹은 기대빈도라고 한다. 획득도수와 기대도수가 5보다 작은 cell 이 전체 칸 수의 20% 이하이어야 한다.


– 각 칸에 떨어져 있는 도수는 각각 독립적이어야 한다. 어떤 칸에 해당된 사7는 다른 칸에 해당된 사례와 상관이 없는 독립적 관계여야 함.



동질성 연구 : 여러 모집단으로부터 각각의 표본을 추출하여 각 모집단의 속성이 유사한가를 검정하는데 목적이 있음. 여러개의 모집단으로부터 각각의 표본이 추출됨


상관성 연구 : 한 모집단으로부터 하나의 표본이 추출되어 표본의 각 사례에서 두 변수를 관찰하여 두 변수가 서로 관계가 있는지를 검정하는 방법. 한 모집단으로부터 하나의 표본이 추출되어 카이자승검정을 실시하는 것.



A. 두 집단 동질성 연구


연구과정에서 얻은 도수로 획득도수. ; 주변도수 ;


지금부터 Karl pearson 이 제안한 카이자승검정의 기본원리.


영가설하에서 얻어질 것이라 기대되는 사례 수는 기대도수 혹은 기대빈도라고 하며.


영가설이 사실이라면 획득도수와 기대도수의 차이가 없을 것이다. 또한 획득도수가 영가설 하에서 추정된 기대도수와 차이가 심할 수록 영가설과 멀어지는 결과를 가져오게 됨.



B. 다집단 동질성 연구


집단이 세 집단 이상이며 응답범주 혹은 분류범주가 세 개 이상인 경우에 집단간에 따른 응답비율 차의 검정을 실시.




동질성 연구의 사후비교분석


카이자승 검정을 위한 영가설은 모든 범주에 대한 집단간의 비율이 같다는 거대한 가설로 이를 전체 가설이라고 한다. 이러한 전체 가설이 기각 혹은 부정된다는 것은 최소한 하나 이상의 집단간의 비교가 같이 않기 때문. 대비를 파이라고 하며, 짝비교-한집단을 다른 한집단 든 복합비교 두 집단 이상을 합성하여 다른 집단과 비교 든.


Goodman 이 종속변수가 질적변수일 때 대비에 대한 분석을 실시.



모든 가능한 대비 중에 하나의 대비가 가져야할 유의수준은 a / 가능한 모든 대비수



——


1 카이자승 검정을 실시하여 영가설 기각여부를 확인할 필요가 없음. 카이자승 통계값 계산 불필요.


2 대비에 대한 표준오차를 계산할 때 해당 범주에 응답한 집단의 비율을 사용하지 않고 그 범주에 응답한 모든 사람의 확률을 사용한다.


3 a/ 가능한 모든 대비수가 기각값이 아니라 , 관심있는 대비만 가지고 검정을 실시하게 되므로 유의수준은 연구에서 설장한 관심있는 대비 수로만 나눈, 부분적인 유의수준에 해당하는 기각값을 찾아야 한다.




사전비교분석을 위한 기각값은 절대값이 작다. 유의수를 한정된 대비수로 나누었기 때문.


—–


상관성 연구


A. 2×2 분할표에 의한 상관연구 : 파이계수 검정


파이 계수 : 두 변수가 이분변수 일 때 두 변수간의 상관관계를 나타내는 지수.,


성별과 산아제한에 대한 찬반의 상관연구.



루트 카이자승 / n = 파이계수



— I J 분할표 상관연구 – Cramer 의 V


인종과 머리카락 색, 직업의 여러종류와 지각상태 0




카이자승 검정시 주의점.



– 분할표에 떨어진 도수는 각각 독립적이어야함. 반복행위가 각 칸에 분류되었다면 안됨.


– 획득빈도가 0혹은 1로 되어 있는 칸의 수가 많음에도 실시. 질문에서 필요없는 범주를 만들어 놓았다. 이론적 배경이 약하다는 암시



– 실제 상황에서 각 자료, 즉 질적변수의 자료들이 관계가 있을 때 동질성을 비교하는 통계적 방법들 – McNemar검정, Bowker 검정, Stuart 검정


상관연구의 기본 가정 : 선형성, 등분산성, 이상점 유무, 자료절단 여부의 연구



산포도에 나타난 모든 점들을 대표하는 직선 – 회귀선


– 산포도에 있는 모든 점들이 자료를 대표하는 직선 쪽으로 회귀한다. 회귀등식 계산- 최소자승법 : X값을 회귀등식에 대입하여 나타난 기대되는 값과 Y값과의 차이를 가장 작게 해야함.



회귀계수 : Rxy * Sy/Sx 만약 완벽한 상관(1) 이면 기울기는 Sy/Sx 평균X 평균Y 를 반드시 지나게 됨. (절편 계산)




관찰된 개인점수 – 평균 = (기댓값- 평균) + (관찰된 점수 – 기댓값)


기댓값 – 평균 은 회귀선에 의하여 결정된 값으로 설명된 편차


관찰된점수- 기댓값 은 개인차 혹은 측정의 오차에 의하여 발생하는 설명되지 않은 편차



총편차제곱합 = 설명된 편차제곱합 + 설명되지 않은 편차제곱합



상관계수가 1이라면 총변화량에는 설명된 변화량만 존재함을 말함.


결정계수(상관비) : 변화량의 얼마만큼이 설명되었는가, 총변화량의 설명된 변량의 비율.


R2 설명된 변화량 / 총변화량 SSe/ SSt



 Leave a Reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>