티스토리 뷰
728x90
[ 밑줄 ]
기계학습은 크게 (1)지도학습, (2)비지도학습, (3) 강화학습 세 가지로 분류할 수 있습니다.
지도학습이란 말 그대로 교사의 지도에 따라 학습하듯이 정답을 이미 알고 있는 경우에 사용하는 학습 방법입니다.
문제와 그 정답의 쌍(이 쌍을 가리켜 '학습 데이터' 혹은 '훈련 데이터'라고 부릅니다)이 주어진 상태로 학습을 진행합니다. 이미 정답을 알고 있기 때문에 문제를 푼 뒤 그 결과를 정답과 비교해서 정답과의 오차가 적어지도록 인공지능의 동작(내부 파라미터)를 수정해 나갑니다.
비지도학습이란 정답이 없을 경우의 학습 방법이다.
우리가 평소에 체감하기 쉬운 예를 들자면, 문제만 실려있고 해답이 실려있지 않은 문제집과 비슷하다고 할 수 있겠습니다.
문제를 관찰함으로써 비슷한 문제의 집합을 발견하고, '문제에는 이런 타입이 있구나'하고 이해할 수 있기 때문입니다.
문제이 집합이 보이게 되면 미지의 문제에 직면하더라도 어떤 집합에 속하는 문제인지 인식할 수 있게 되므로 한결 대응하기 쉬워집니다.
강화학습에서는 시행착오를 거쳐 가며 최적으로 보이는 '행동 방법'을 학습합니다.
이때의 '행동 방법'을 가리켜 '정책'(Policy)이라고 부릅니다.
시행착오의 결과로 우연히 최적의 방법을 발견하고 한다. 이때 일련의 행동을 기억해 두었다가 추후 비슷한 상황에 직면했을 때 가능한 한 같은 행동을 하는 것이 강화학습입니다.
[ 연결 ]
[ 자평 ]
'지능 > 인공지능' 카테고리의 다른 글
김대식의 인간 vs 기계 (0) | 2020.07.25 |
---|---|
어느 책인지 모름.... (0) | 2020.07.06 |
로봇은 인간을 지배할 수 있을까 by 이종호 (0) | 2020.07.06 |
로봇에게 일자리를 빼앗겨도 걱정 말아요 by 페데리코 피스토노 (0) | 2020.07.04 |
미래의 컴퓨터 by 알랭 슐 (0) | 2020.07.04 |
댓글
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 데브옵스 도입 전략
- 복잡계의 새로운 접근
- 전략에 전략을 더하라
- 경계의 종말
- Ai
- 부정성 편향
- 상대성이론
- 스케일의 법칙
- 함께 있으면 즐거운 사람
- 혁신
- 제로 성장 시대가 온다
- 이노베이션
- 최진석
- 고도를 기다리며
- 사회물리학
- 참을 수 없는 존재의 가벼움
- 함께 있으면 피곤한 사람
- 경영혁신
- 개발자가 아니더라도
- 양자역학
- 불교
- 개발자에서 아키텍트로
- 안나 카레니나
- 인공지능
- 플랫폼의 시대
- 돈
- 파괴적 혁신
- 직감하는 양자역학
- 당신은 AI를 개발하게 된다
- 디지털 트랜스포메이션 엔진
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
글 보관함