데이터과학

    가설과 P-Value의 의미

    가설과 P-Value의 의미

    우리는 많은 상황에서 모집단에 관한 정보를 알지 못한다. 만약 모집단에 대한 정보를 안다면 표본을 추출하고 분석하여 모집단을 추론하는 일은 없을 것이다. 가설검정도 모집단을 검정할 목적으로 설정하는 모수에 대한 잠정적인 주장이나 가정을 말한다. 표본을 추출하여 분석하는 과정에서 새로운 사실을 발견했을 때 해당 사실이 모집단에서도 적용되는지를 위해 가설을 세우고 검정하는 절차를 지킨다. 귀무가설과 대립가설 가설을 검정할 때 사용되는 가설은 귀무가설과 대립가설로 2가지 이다. 귀무가설 (Null Hypothesis) 모집단의 특성에 대해 옳다고 제안하는 잠정적인 주장으로 과거의 경험, 지식 또는 연구의 결과 등 현재까지 이어져오는 인정된 것을 의미한다. 대립가설 (Alternative Hypothesis) ..

    [데이터 과학] 베이즈 정리

    [데이터 과학] 베이즈 정리

    베이즈 정리에 앞서 간단한 확률 이론을 정리하고 시작한다. 확률 확률은 어떤 사건이 일어날 수 있는 확실성의 정도를 뜻한다. 확률은 0에서 1 사이의 값을 가지며 모든 사건에 대한 확률의 합은 1이라는 특징을 가진다. 베이즈 정리를 작성하기 전에 몇 가지 용어를 정리하려 한다. 각 용어는 확률에서 기초적인 내용이며 추후 지속적으로 해당 용어를 사용하기에 사전에 정리한다. 확률실험 확률실험은 확률을 구하기 위한 실험 또는 시행이라 부르며 아래 3가지 조건을 만족할 때 확률실험이라 한다. 어떤 실험을 통해 나타나는 결과를 예측할 수 없음. 동일한 조건으로 실험을 반복하여도 임의의 형태로 결과가 나타난다. 동일한 실험을 반복할 수 있다. 표본공간 확률 실험을 할 때 발생 가능한 모든 결과의 집합이다. 주로 대..

    [데이터 과학] 0. 들어가기 앞서 (용어 및 기본 정리)

    [데이터 과학] 0. 들어가기 앞서 (용어 및 기본 정리)

    데이터 과학을 학습하며 내용을 정리하기에 앞서 알고있으면 좋은 용어 및 간단한 도표등을 정리한다. 특히 통계와 관련된 내용을 주로 정리하고자 한다. 1. 통계학 기본 통계학이란 관심대상에 대하여 관련된 자료를 수집하고 그 자료를 요약, 정리하여 결과를 도출해내는 것이다. 이 때의 결과는 불확실한 사실에 대한 결론일 수 도 있고, 일반적인 자료의 규칙을 찾아내는 과정일 수도 있다. 모집단과 표본 모집단 (Population) : 통계적인 관찰의 대상이 되는 집단 전체 표본 (Sample) : 직접적인 조사 대상이 되는 모집단의 일부 표본추출 (Sampling) : 모집단으로부터 표본을 선택하는 행위로 크게 확률적 추출과 비확률적 추출로 나뉜다. 통계량 (Statistics) : 표본을 분석하여 얻어지는 결..