본문 바로가기

기초통계

통계학 기초 정리 (3) : 각종 검정 방법 (t검정, 다중 검정, 카이제곱 오류), 제 1종 오류와 제 2종 오류

1. t검정

두 집단 간의 평균 차이가 통계적으로 유의미한지 확인하는 검정 방법

  • 독립표본 t검정(Independent T - test) : 두 독립된 그룹의 평균을 비교
  • 대응표본 t검정(Paired T-test) : 동일한 그룹의 사전/사후 평균을 비교

독립표본 t 검정은 두 집단이 서로 독립적인 경우에 사용 / 대응표본 t 검정은 두 집단이 서로 관련성이 있는 경우에 사용

https://www.technologynetworks.com/informatics/articles/paired-vs-unpaired-t-test-differences-assumptions-and-hypotheses-330826

 

✅참고 자료 

 

[Python / Study] 독립표본, 대응표본 t-test 공부하기

1. 대응표본 대응표본이란 같은 대상에 대해 두 번의 측정을 한 후 두 측정치의 평균이 차이가 있는지 비교하는 통계적 방법입니다. 예를 들면 처치나 중재, 약물, 교육, 치료 등의 효과를 알아보

jangcoding77.tistory.com

 

 

2. 다중 검정(multiple testing)

여러 가설을 동시에 검정하는 것

  • 각 검정마다 유의수준을 조정해주어야 한다. 
  • 보정방법: 본페로니 보정이 가장 대표적, 튜키 보정, 던넷 보정, 윌리엄스 보정 

보정할 때 유의 수준을 최대한 엄격하게 바꿔주어야 한다. 

유의수준을 조정할 때 p-value 값의 길이만큼 나누어 주는 것이다. 

 

 

3. 카이제곱 검정 (Chi square test)

범주형 데이터의 분석에 사용.

  • 범주형 데이터의 표본 분포가 모집단 분포와 일치하는 검정하는 것
  • 두 범주형 변수 간의 독립성을 검정

변수 간의 분포를 보는 것인가? 표본 분포와 모집단 분포 간의 관계를 보는 것인가? 

 

(1) 적합도 검정

관찰된 분포와 기대된 분포가 일치하는 지 검정

p값이 높으면 데이터가 귀무 가설에 잘 맞음. 즉, 관찰된 데이터와 귀무가설이 적합

p값이 낮으면 데이터가 귀무 가설에 잘 맞지 않음. 즉 관찰된 데이터와 귀무 가설이 부적합

 

(2) 독립성 검정

두 범주형 변수 간의 독립성을 검정

 

4. 제 1종 오류와 제 2종 오류 

 

(1) 제 1종 오류

귀무가설이 참이지만 기각하는 오류

위양성: 아무런 영향이 없는데 영향이 있다고 하는 것

알파를 경계로 귀무가설을 기각하기 때문에 제 1종 오류가 알파만큼 발생

유의수준을 낮출수록 알파가 줄어들기 때문에 1종 오류가 줄어든다. 

 

만약, 유의수준이 0.05라면 100번 중 5번 정도 일어날 수 있는 1종 오류는 감수하겠다. 

 

(2) 제 2종 오류

귀무가설이 거짓인데 기각하지 않는 오류

위음성: 영향이 있는데 영향이 없다고 하는 것

제 2종 오류가 일어날 확률은 β 로 정의하고, 일어나지 않을 확률은 검정력(1- β)로 정의함. 

표본크기를 늘릴 수 있어야 한다.