티스토리 뷰

728x90

[ 밑줄/연결 ]

 

지도학습은 미리 훈련 데이터를 클래스 별로 분류 시켜 놓고 분류 함수를 계산하여 새로운 데이터를 분류 함수에 따라 특정 클래스로 분류하는 방법이다. 대부분의 패턴인식 및 머신러닝 문제는 훈련 데이터를 이용하여 분류함수를 미리 계산하여 인식에 활용하는 지도학습에 기반을 두고 있다. 지도학습은 크게 분류(classification)과 회귀(regression)로 나누어 볼 수 있다.

 

(1) 분류

기존에 존재하는 데이터와 클래스와의 관계를 학습하여 새로 관측된 데이터의 클래스 레이블을 판별하는 알고리즘...훈련 데이터와 훈련 데이터의 클래스 레이블이 주어지면 훈련데이터로부터 특징을 선택하고 이를 기반으로 분류 알고리즘을 학습함. 이렇게 학습된 데이터에 새로운 새로운 데이터가 추가되면 동일한 특징이 추출되고 학습된 분류 알고리즘에 따라 클래스 레이블을 할당함.... 대표적인 분류 방법에는 베이즈 정리(추론), 최대우도 최대 사후, 퍼지로직, 결정트리, 인공 신경망 등의 방법이 있음

비도학습은 미리 훈련 데이터의 클래스를 분류시켜 놓지 않고 입력된 훈련 데이터의 특성을 분석하여 특성이 비슷한 몇 개 군집(cluster)으로 분류한다. 학습이 끝난 뒤에 새롭게 입력되는 테스트 데이터를 k개의 군집 중 하나로 분류한다....비지도 학습기반의 군집화 알고리즘은 주어진 훈련 데이터의 특성(색상, 크기, 무게, 길이 등 등)을 파악하여 유사성을 검사하고 훈련 데이터의 유사성에 따라 자동으로 K개의 군집으로 분류하는 분류함수를 만들어 낸다. 대표적인 군집화 알고리즘으로는 k-means 군집화가 있다. 

(특징)

어떤 사물이나 대상체를 표현할 수 있는 두드러진 특성(형태, 질감, 색상, 소리 등 등)을 말함. 물고기의 경우 길이, 밝기, 색상, 지느러지 수, 지느러미 모양, 입의 위치 등 성질들을 특징들로 뽑아 낼 수 있다. 이렇게 추출된 특징들은 벡터로 표현할 수 있는데 만약 특징의 수가 6개라고 하면 6차원의 특징벡터 x가 만들어질 수 있다. 

 

(일반화 능력)

지도학습에서 분류기는 훈련 데이터로 학습이 되는데 만약 훈련에 참여하지 않은 새로운 데이터가 주어졌을 경우에 대해서도 학습된 분류기가 정확하게 예측할 수 있으면 이를 일반화 되었다고 한다. 

 

(특징 추출)

숫자 인식....입력된 숫자로부터 edge를 출력하고 edge 영역으로부터 0~9사이의 숫자가 뚜렷이 구분될 수 있는 특징을 추출해야 한다. 만약 숫자 구분 특징으로 수직선 개수, 수평선 개수, 대각선 개수, 커브의 개수, 원의 개수를 정했다면 각각의 숫자들로부터 아래와 같은 특징을 추출할 수 있다.

 

[ 자평 ]

 

....그저 그런....

댓글