AI/Data Science

[분석통계] 정규성 검정

Linuxias 2023. 5. 29. 08:00
반응형

정규성 검정

정규성 검정은 3가지 방법으로 검정을 진행한다. 검정 방법은 시각화 또는 가설 검정을 이용한 방법으로 나뉜다. 가설검정을 이용 시 귀무가설 '$H_{0}$는 모집단의 분포는 정규분포이다' 가 된다.

  • Q-Q Plot
    • 시각화를 이용한 정규성 검정방법
  • Shapiro-Wilks Test
from scipy import stats
stats.shapiro(df)
  • Kolmogorov-Smirnov Test (KS-Test)
    • KS-Test 는 누적분포함수를 비교하는 방법이다.
    • 따라서 이론정규분포와 표본의 누적분포함수(cdf)를 비교한다.
    • 아래 코드에서 주의할 점은 kstest 전 데이터를 표준화 전처리가 필수적으로 수행되어야 한다.
from scipy import stats
data = (df - df.mean()) / df.std()
stats.kstest(data, stats.norm.cdf)
반응형