* 카이제곱 검정 (chi-square test)
우리가 가진 변수가 모두 명목척도일 때, 사용하는 분석 방법
- t-test와 ANOVA는 명목척도일 때, 사용할 수 없음
- 교차분석이라고도 함
- chi-square value와 chi-square 분포를 가진다.
* 카이제곱 검정을 언제 할까?
- 변수가 명목척도일 때
- 자료(데이터)의 값은 개수(count)여야 함
* 카이제곱 검정의 목적
1) 변수가 한 개인 경우 : 변수내 그룹간의 비율(proportion)이 같은지 다른지
-> 단, 그룹이 2개인 경우 Binomial test
-> 그룹이 여러개인 경우 카이제곱 검정
2) 변수가 두 개인 경우 : 변수 사이의 연관성(Association)이 있는지 없는지
ex) 휴대폰 사용과 뇌암(Brain Cancer), 인종과 특정 질병
* 카이제곱 값
ㄴ 관찰빈도는 데이터에서 자연적으로 주어지고,
ㄴ 기대빈도는 별도의 방법으로 구해야 함
ㄴ 기대빈도란 개념적으로 이래야 한다는 기대 수치와 유사한 개념
ex) 고객 데이터에서 특별한 이유가 없는 한, 남성 고객과 여성 고객의 빈도는 동일하게 나타나야 할 것이라는 가정
만약 총 1,000명의 고객 데이터가 있다면 남성과 여성 고객의 기대빈도는 각각 500명/500명일 것이다.
1. 일원 카이제곱 검정(One-way x^2 test)
예를 들면,
- payment method라는 변수는 총 4개의 범주로 구성되어 있다.
- 고객의 지불방법이 차이가 나는지 알고 싶다면,
- 즉, 각 범주별로 고객의 수가 다를 이유가 없다면 정말 그런지 검정한다.
- 결론적으로, 일원 카이제곱 검정의 유의성이 의미하는 것은 무엇인가 다르다 정도이다.
- 여기서 다르다는 의미는 사전에 정해진 기대빈도와 다르다는 의미이다.
- 만약, 기존의 연구나 이론에 의해 각 기대빈도가 다르게 나올 수 있다면, 기대빈도 자체를 바꿔서 테스트하면 된다.
ex) 위의 기대빈도를 1 : 1 : 1 : 1으로 적용하는 것이 아니라, 1 : 1 : 2 : 1로 적용한다면 1049 : 1049 : 2817 : 1049가 된다.
- 따라서, 카이제곱 검정을 적합도(goodness of fit)이라고 부르기도 한다.
'통계학' 카테고리의 다른 글
군집분석 설명 및 간단 분석 with 논문 (0) | 2023.05.16 |
---|---|
t-test (0) | 2021.12.19 |
표준정규분포 (0) | 2021.12.11 |
회귀분석(Regression) (0) | 2021.12.05 |
기초 통계학 (0) | 2021.11.20 |