지능/인공지능
주머니 속의 머신러닝 by 맷 해리슨
비즈붓다
2023. 6. 11. 19:13
728x90
[ 밑줄/연결 ]
(머신러닝 과정에 대한 개요)
ㅇ 비즈니스의 이해
ㅇ 데이터의 이해
ㅇ 데이터의 준비
ㅇ 모델링
ㅇ 검증
ㅇ 배포
(데이터에 관한 용어)
모델은 행렬 형태의 데이터로 학습되는 것이 일반적
(데이터의 정리)
수치형(정수나 부동소수) 특징으로 변환
누락된 값 이상치 등 체크
(데이터 전처리)
표준화 (평균을 0, 표준 편차를 1로 만드는 것 등)
범위 조정하여 그 값이 0과 1 사이가 되도록 하는 것
더미 변수 생성하여 '원-핫 코딩' 등
(특징추출)
상관관계 비교 (ex: 히트맵)
상관성이 높은 열들은 별다른 가치가 없으며, 특징 중요도 및 회귀 계수이 해석을 의미 없게 만들 수 있음
(모델의 최적화)
모델의 행동을 제어하는 하이퍼파라미터(hyperparameter)
하이퍼파라미터의 값을 달리하여 성능에 변화를 줄 수 있음
서로 다른 하이퍼파라미터의 조합으로 모델을 검증하고, 그 중 최고의 결과를 도출한 하이퍼파라미터를 변환함
반환된 최고이 조합으로 모델의 인스턴스를 만들 수 있음
[ 자평 ] 작고 깜찍한 책... 개발자를 위한 책...머신러닝 중심...