AI/Data Science

가설과 P-Value의 의미

Linuxias 2023. 4. 11. 23:02
반응형

 

우리는 많은 상황에서 모집단에 관한 정보를 알지 못한다. 만약 모집단에 대한 정보를 안다면 표본을 추출하고 분석하여 모집단을 추론하는 일은 없을 것이다. 

가설검정도 모집단을 검정할 목적으로 설정하는 모수에 대한 잠정적인 주장이나 가정을 말한다. 표본을 추출하여 분석하는 과정에서 새로운 사실을 발견했을 때 해당 사실이 모집단에서도 적용되는지를 위해 가설을 세우고 검정하는 절차를 지킨다.

 

귀무가설과 대립가설

가설을 검정할 때 사용되는 가설은 귀무가설과 대립가설로 2가지 이다.

  • 귀무가설 (Null Hypothesis)
    • 모집단의 특성에 대해 옳다고 제안하는 잠정적인 주장으로 과거의 경험, 지식 또는 연구의 결과 등 현재까지 이어져오는 인정된 것을 의미한다.
  • 대립가설 (Alternative Hypothesis)
    • 귀무가설이 틀렸다고 제안하는 가설로서 귀무가설이 기각되면 채택하게 되는 가설을 의미한다.
    • 대립가설은 연구자가 새로운 변화 또는 사실이 존재한다는 주장을 나타내는 것으로 실제 연구자는 귀무가설을 부정하고 대립가설을 지지한다.

예를 들어, 비만과 성인병 유발에 영향을 미치는지 연구자가 연구한다고 할 때, 가설을 귀무가설과 대립가설 2가지로 세우게 된다.

  • 귀무가설 : 비만과 성인병 유발에 영향을 미치지 않는다.
  • 대립가설 : 비만은 성인병 유발에 영향을 미친다.

일반적으로 생각하면 대립가설만 가설로 세운 후 사실 여부를 검정하면 될 것이라 판단하는데 왜 귀무가설을 세우고 귀무가설을 기각되면 대립가설이 사실이라고 판단하는 방법을 사용하는 것일까?

해당 이유는 '공돌이의 수학정리노트' 블로그에 작성자님께서 매우 잘 정리해주셨다. 사유는 아래와 같다.

  1. 참이 아님을 증명하는 것이 참임을 증명하는 것보다 훨씬 쉽기 때문이다.
  2. 귀무가설을 “올바르게” 서술하는 것이 대립가설을 “정확하게” 서술하는 것 보다 실패할 가능성이 적다.
  3. 우리는 모수에 대해서 알 수 없으며, 연구에 있어 주관성이 개입되어선 안되기 때문이다.
    • 이러한 관점에 있어서 대척점에 서계신 분들이 바로 베이지안 통계학자들이다

그렇다면 이러한 귀무가설이 옳은지 아닌지 어떻게 확인할 수 있을까? 이러한 가설을 검정하기 위해 사용하는 것이 p-value 이다. 

가설검정의 절차

가설검정은 아래와 같은 절차로 검정을 진행을 진행한다.

  1. 귀무가설과 대립가설을 세운다.
  2. 귀무가설이 맞다는 전제하에 절차를 시작한다.
  3. 대립가설에 대한 증거값을 계산한다. (검정통계량)
  4. 두 가지 의사결정이 가능한
    • 충분한 증거에 의해 대립가설이 옳다고 판단 (Reject $H_{0}$)
    • 불충분한 증거에 의해 귀무가설 기각 못함 (Don't reject $H_{0}$)

 

p-value

p-value는 가설검정에 사용되는 value이다. 귀무가설에서 주장한 바가 옳을 확률이 p-value인 것이다. 귀무가설이 참이라는 가정 아래 얻어지는 통계량이 귀무가설을 얼마나 지지하는지를 나타내는 확률 값으로 산출된 p-value가 작을수록 표본이 모수에 대하여 귀무가설을 기각할 증거가 충분하다고 해석할 수 있다.

위의 범위에서 0 ~ 0.05 범위의 p-value는 귀무가설을 기각할, 즉 귀무가설이 참이 아닐 확률이 높은 구간이고, 0.1 ~ 1 범위의 p-value는 귀무가설이 참일 확률이 높은 값이다.

그렇다면 0.05 ~ 0.1 사이의 p-value는 어떻게 해석해야 할까? 해당 구간은 Undeterminded 구간으로 부르며, 주관적인 판단이 필요하다. 만약 p-value가 0.07이라고 하면 본인이 주관적으로 귀무가설을 기각할 확률이 높은 값인지 아닌지 판단하여 처리한다.

하나의 예시를 확인해보자. 모집단 A에서 10개의 표본을 추출한다. 여기서 귀무가설과 대립가설은 모집단 평균에 관련된 것이다.

x1,x1,.. x10까지 총 10개의 표본의 평균을 구한 뒤 검정통계량을 구한다. 이때 구한 검정통계량 값이 얼마나 큰 차이를 나타내는지 아니면 작은 차이를 나타내는지 파악하기 위해 p-value를 사용한다. 

p-value는 특정 분포를 따르게 되는데, 많은 과학자 분들이 p-value는 T-분포를 따른다는 것을 증명하였고, 해당 내용은 여기서 다루지는 않는다.

출처 : https://w7.pngwing.com/pngs/281/694/png-transparent-p-value-statistical-significance-statistics-null-hypothesis-test-statistic-statistical-significance.png

T-분포를 따르기에 위와 같은 T-분포의 구간에 맞춰 어디서 p-value가 위치하는지 확인하고 그에 따라 귀무가설을 채택할지 기각할지 기준의 값으로 사용한다.

 

참고자료

반응형