반응형
정규성 검정
정규성 검정은 3가지 방법으로 검정을 진행한다. 검정 방법은 시각화 또는 가설 검정을 이용한 방법으로 나뉜다. 가설검정을 이용 시 귀무가설 '$H_{0}$는 모집단의 분포는 정규분포이다' 가 된다.
- Q-Q Plot
- 시각화를 이용한 정규성 검정방법
- Shapiro-Wilks Test
from scipy import stats
stats.shapiro(df)
- Kolmogorov-Smirnov Test (KS-Test)
- KS-Test 는 누적분포함수를 비교하는 방법이다.
- 따라서 이론정규분포와 표본의 누적분포함수(cdf)를 비교한다.
- 아래 코드에서 주의할 점은 kstest 전 데이터를 표준화 전처리가 필수적으로 수행되어야 한다.
from scipy import stats
data = (df - df.mean()) / df.std()
stats.kstest(data, stats.norm.cdf)
반응형
'AI > Data Science' 카테고리의 다른 글
[Metrics] 분류 모델 평가를 위한 지표는 어떻게 선정해야 하는가? (2) | 2023.12.02 |
---|---|
[결측치 확인] Missingno 이용하기 (0) | 2023.11.30 |
[분석통계] 통계적 검정 방법 간단 정리 (0) | 2023.05.27 |
[ANOVA] 일원 / 이원분산분석 해보기 (상호작용항) (0) | 2023.04.20 |
[Pandas] 여러 Column 동시에 추가하기 (assign) (0) | 2023.04.19 |