본문 바로가기

통계학

카이제곱 검정

* 카이제곱 검정 (chi-square test)

우리가 가진 변수가 모두 명목척도일 때, 사용하는 분석 방법

- t-test와 ANOVA는 명목척도일 때, 사용할 수 없음

- 교차분석이라고도 함

- chi-square value와 chi-square 분포를 가진다.

 

* 카이제곱 검정을 언제 할까?

- 변수가 명목척도일 때

- 자료(데이터)의 값은 개수(count)여야 함 

 

* 카이제곱 검정의 목적

1) 변수가 한 개인 경우 : 변수내 그룹간의 비율(proportion)이 같은지 다른지

-> 단, 그룹이 2개인 경우 Binomial test 

-> 그룹이 여러개인 경우 카이제곱 검정

2) 변수가 두 개인 경우 : 변수 사이의 연관성(Association)이 있는지 없는지

ex) 휴대폰 사용과 뇌암(Brain Cancer), 인종과 특정 질병 

 

* 카이제곱 값

ㄴ 관찰빈도는 데이터에서 자연적으로 주어지고, 

ㄴ 기대빈도는 별도의 방법으로 구해야 함 

ㄴ 기대빈도란 개념적으로 이래야 한다는 기대 수치와 유사한 개념 

ex) 고객 데이터에서 특별한 이유가 없는 한, 남성 고객과 여성 고객의 빈도는 동일하게 나타나야 할 것이라는 가정

만약 총 1,000명의 고객 데이터가 있다면 남성과 여성 고객의 기대빈도는 각각 500명/500명일 것이다.

 

1. 일원 카이제곱 검정(One-way x^2 test)

예를 들면,

- payment method라는 변수는 총 4개의 범주로 구성되어 있다.

- 고객의 지불방법이 차이가 나는지 알고 싶다면,

- 즉, 각 범주별로 고객의 수가 다를 이유가 없다면 정말 그런지 검정한다.

- 결론적으로, 일원 카이제곱 검정의 유의성이 의미하는 것은 무엇인가 다르다 정도이다.

- 여기서 다르다는 의미는 사전에 정해진 기대빈도와 다르다는 의미이다. 

- 만약, 기존의 연구나 이론에 의해 각 기대빈도가 다르게 나올 수 있다면, 기대빈도 자체를 바꿔서 테스트하면 된다.

ex) 위의 기대빈도를 1 : 1 : 1 : 1으로 적용하는 것이 아니라, 1 : 1 : 2 : 1로 적용한다면 1049 : 1049 : 2817 : 1049가 된다.

- 따라서, 카이제곱 검정을 적합도(goodness of fit)이라고 부르기도 한다.  

'통계학' 카테고리의 다른 글

군집분석 설명 및 간단 분석 with 논문  (0) 2023.05.16
t-test  (0) 2021.12.19
표준정규분포  (0) 2021.12.11
회귀분석(Regression)  (0) 2021.12.05
기초 통계학  (0) 2021.11.20