티스토리 뷰

728x90

[ 밑줄/연결 ]

 

(머신러닝 과정에 대한 개요)

ㅇ 비즈니스의 이해

ㅇ 데이터의 이해

ㅇ 데이터의 준비

ㅇ 모델링

ㅇ 검증

ㅇ 배포

 

(데이터에 관한 용어)

모델은 행렬 형태의 데이터로 학습되는 것이 일반적

(데이터의 정리)

수치형(정수나 부동소수) 특징으로 변환

누락된 값 이상치 등 체크

 

(데이터 전처리)

표준화 (평균을 0, 표준 편차를 1로 만드는 것 등)

범위 조정하여 그 값이 0과 1 사이가 되도록 하는 것

더미 변수 생성하여 '원-핫 코딩' 등 

 

(특징추출)

상관관계 비교 (ex: 히트맵)

상관성이 높은 열들은 별다른 가치가 없으며, 특징 중요도 및 회귀 계수이 해석을 의미 없게 만들 수 있음

 

 

(모델의 최적화)

모델의 행동을 제어하는 하이퍼파라미터(hyperparameter)

하이퍼파라미터의 값을 달리하여 성능에 변화를 줄 수 있음

서로 다른 하이퍼파라미터의 조합으로 모델을 검증하고, 그 중 최고의 결과를 도출한 하이퍼파라미터를 변환함

반환된 최고이 조합으로 모델의 인스턴스를 만들 수 있음

 

 

 

[ 자평 ]  작고 깜찍한 책... 개발자를 위한 책...머신러닝 중심...

댓글