반응형
1. 지도 학습이란?
지도학습 혹은 감독학습이라고도 불립니다. 감독 혹은 지도받은 내뇽에 기반하여 학습하는 방법을
말합니다. 지도 학습은 말 그대로 옳고, 그름을 알려주는 지시자(교육자)가 존재하고, 그 옳고 그른 데이터에 의해 학습하는 방법입니다. 이런 의미에서 교사학습이라 불리기도 하는데요.
이와 반대되는 개념으로, 어떠한 학습 사례나, 학습 방법, 등을 지시/감독 받지 않고, 학습을 하는 방법을 비지시, 비감독 또는 비교사 학습이라고 합니다.
일반적으로 개인의 독학보다는, 개인에게 교사가, 지식을 전달해준 눈군가가 있다는 것은 더욱 효율적이고 정밀하게 학습할 수 있는 환경을 만들어 줍니다. 학습에 관해 교사에게 옳고, 그름을 배울 수 있으므로 다른 학습 방법보다 빠르고 정확한 학습을 할 수 있습니다.
하지만, 그 이후의 단점을 생각해 본다면, 독학이 일반적으로 학습 속도가 느리고, 때때로 잘못된 지식이 잘못 된 지식인 줄 모른다 하여도! 스스로 터득한 지식과 학습법은 무궁무진하게 응용할 수 있다는 장점이 있는 것이다.
2. 분류 지식 학습
분류 지식 학습은 감독학습의 응용 분야라기 생각하면 쉽다. 분류 지식 학습은 어떠한 데이터에 대해 그 데이터가 옳은 데이터 인지 아닌지에 대해 분류하기 위한 학습법이다. 즉, 몇가지 데이터를 토대로 그 데이터가 어느 카테고리에 속하는지 학습시키고 그 사례에서 분류 지식을 구분하는 식으로 학습을 한다.
지도학습의 주어진 문제를 해결하기 위해서는 다음의 step 들을 고려하여야 한다.
- 훈련예들의 유형 (type) 을 결정한다. 다른 것을 하기전에 엔지니어는 예로서 사용되는 데이터가 어떤 종류의 데이터 인지를 결정해야 한다. 예를들면, 이것이 단 하나의 필기체 문자인지, 전체 필기체 단어인지, 전체 필기체 문장인지 와 같은 것이다.
- 훈련 집합을 모은다. 훈련집합은 함수가 실세계에서의 특징을 보일 필요가 있다. 그래서 전문가에 의해서든 측정을 해서 얻어지든, 입력대상 집합이 모아지고 동등한 출력이 모아져야 한다.
- 학습함수 (learned function) 의 입력 특징 (feature) 표현 을 결정한다. 학습함수의 정확성은 입력대상이 어떻게 표현되느냐에 크게 좌우된다. 보통 입력대상은 feature vector 로 바뀌고, 대상을 묘사하는 특징적인 수를 포함한다. Feature 의 갯수는 차원의 한계 (curse of dimensionality) 때문에 너무 커서는 안되지만, 출력을 정확히 예상할 수 있을 정도로는 충분히 커야 한다.
- 학습함수의 구조와 동등한 학습 알고리즘을 결정한다. 예를들면 엔지니어는 신경망 (Neural Network) 을 사용할건지, 의사결정 트리 (Decision Tree) 를 사용할 것인지를 선택할 수 있다.
- 설계를 완성한다. 그리고 나서 모아진 훈련집합 상에서 훈련 알고리즘을 작동시킨다. 학습알고리즘 의 인수 (parameter) 들은 subset (소위 validation set) 에서의 성능을 최적화 함으로써, 또는 cross-validation 을 통해 조정될 수 있다. Parameter 조정과 학습 후에, 알고리즘의 성능은 훈련집합에서 분리된 test set 상에서 측정될 수 있다
반응형
'AI > Machine Learning' 카테고리의 다른 글
유전 학습 - 2 (0) | 2014.05.23 |
---|---|
유전 학습 - 1 (0) | 2014.05.22 |
n-gram 출현빈도에 기초한 텍스트 데이터 학습 - 2 (0) | 2014.05.19 |
n-gram 출현빈도에 기초한 텍스트 데이터 학습 - 1 (0) | 2014.05.18 |
텍스트 마이닝 - 1 (0) | 2014.05.18 |