티스토리 뷰

728x90

[ 밑줄/연결 ]

 

지능적인 장치란 '사람처럼 생각하거나, 행동하는 시스템'이라고 할 수 있다.

 

사람에게만 가능한 것으로 여겨지는 지능 현상을 컴퓨터에 구현하도록 하는 모든 공학적 아이디어와 방법이 인공지능

 

(기계학습)

ㅇ 기계(컴퓨터)가 학습을 할 수 있도록 하는 인공지능 방법론

 

(패턴인식)

ㅇ 문자, 도형, 음성 등을 컴퓨터는 미세한 변형에 대해서는 동질적 의미를 식별하기 어려운데, 이를 가능하도록 하는 인공지능 방법론

 

(탐색 = 최적화)

ㅇ 가장 좋은 답을 찾아내거나 찾아낸 답을 설명하는 논리를 추론하는 인간의 탐색 능력을 컴퓨터로 구현하는 분야

ㅇ '가장 좋은 답'이란 대게 '가장 좋은 답'이 될 수 있는 후보 답안들을 비교하여 이익의 값이 가장 높은 답을 선택....

ㅇ 어떤 문제를 컴퓨터로 해결하기 위해 식을 만들기 어렵거나 식을 만들어도 계산이 복잡한 문제의 답을 컴퓨터로 쉽게 찾을 수 있도록 하는 인공지능 분야

 

(논리추리)

ㅇ 인간의 언어적 표현을 컴퓨터가 처리할 수 있도록 하고자하는 이론적인 분야

 

(자연언어처리)

ㅇ 인간이 사용하는 자연언어를 분석하여 입력된 문장이나 문단에 대해 원하는 출력을 생성하기 위한 분야

ㅇ 논리추리가 자연언어의 본질적 논리를 컴퓨터 언어로 표현하고자 하는 이론적 방법, 자연언어처리는 실질적으로 인간의 언어를 처리하여 유용한 답을 찾아내는 응용적 관점.. 번역...챗팅봇...음성비서...

 

(딥러닝)

ㅇ 인공 신경망을 이용하는 방식은 복잡한 데이터의 학습에 우수...

ㅇ 정보의 양이 많고 복잡도가 높은 의료영상 데이터를 인식하거나 기계가 할 수 없다고 여겼던 작곡, 작화 등에도 놀라연 능력을 보여주고 있음

 

(기계학습)

ㅇ 기계(컴퓨터)가 학습을 할 수 있도록 하는 인공지능 방법론

 

(지능적 행위)

사람은 감각으로 받아들인 데이터에 통찰을 부여하고 지능적으로 해석하고 활용한다. 이것이 학습의 본질....

사과를 의미하는 데이터의 형태는 모두 다르지만 인간은 사과를 의미하는 무한한 경우의 데이터를 모두 학습하지 않아도 사과를 인지할 수 있다....통찰은 지금까지 보지 못한 데이터에 대해서도 즉시 그 의미를 파악할 수 있게 하는 지능적 행위이다.

(컴퓨터의 능력을 확장시키는 기계학습)

기계(컴퓨터)로 하여금 주어진 데이터의 내용과 데이터 사이의 관계를 학습하여 일반화된 지식을 생성하는 것이 첫번 째 목표.....'일반화된 지식'이란 데이터를 분류하는 기준을 정하는 지식이 아니라 데이터들의 관계를 이해하고 두뇌의 사고과정 속에 추상화시킨 관념을 의미함...

 

기계학습의 두 번째 목표는 일반화된 지식을 사용하여 지능적인 판단이나 행동을 이끌어내는 것....

 

기계학습의 세 번째 목표는 기계의 학습능력을 인간보다 뛰어나게 하여 실질적인 문제에 활용하는 것....

 

(기계가 학습을 할 수 있는 원리)

인간의 학습은 감각 신호로 입력된 신호를 두뇌 신경망을 이루는 신경세포체와 시냅스의 연결 강도를 조절함으로서 두뇌 신경망의 내부에 내재화되는 것....신경 세포들의 연결 패턴이나 강도가 어떤 형태로 지식을 표상하는지 명확히 알 수 는 없지만 두뇌 신경망은 나름의 방식으로 데이터를 읽고 데이터들의 관계나 의미를 구축하는 것...

 

감각 신호 --> 데이터,  두뇌 신경망 --> 알고리즘에 대입할 수 있음. 

두뇌 신경망이 세포의 연결 강도나 패턴을 조정하는 것은 지식의 내재화라고 이야기할 수 있고, 이 과정은 기계학습에서는 '모델을 만든다'라고 표현할 수 있다. 즉 기계학습을 위해 필요한 가장 기본적인 요소는 데이터와 알고리즘, 그리고 모델.....

 

모델: 데이터들 사이에서 파악한 관계나 규칙을 알고리즘을 통해 표현한 것....인공 신경망에서는 신경세포의 연결 강도(가중치)를 수정함으로서 모델을 만들 수 있음.

 

기계학습의 원리는 알고리즘이 데이터를 읽어 데이터 내부 관계를 설명하는 모델을 구축하는 것.....

 

기계학습 알고리즘은 데이터와 그 데이터에 대응된 답을 입력받고 답에 대응하는 데이터 집합들의 관계를 모델로 만듦

 

(학습의 완성은 모델에서 일반화된 지식을 끌어내는 과정)

지능적 판단이나 행동을 위해 학습된 모델을 사용하는 과정은 중요함.

 

두 사람의 판단이 다른 이유는 받아들인 데이터가 다르기 때문이 아니라 내재화된 지식이 다르기 때문임.......사전 지식(모델)이 주어졌을 때 이를 근거해서 새로운 사건 D를 어떻게 해석할 것인지 결정하는 문제가 바로 기계학습의 완성....

 

(매개변수, Parameter)

인간도 학습을 '어떻게' 하는 지에 따라 세밀하게 형성되는 학습 모델은 다를 것... 학습시간, 휴식시간, 한번 학습할 때 공부하는 양 등 학습 결과를 결정할 수 있는 학습 자체의 인자들이 많이 있음. 

 

기계학습에서도 동일한 알고리즘으로 동일한 데이터를 훈련한다고 하더라도 '어떻게' 학습하는지에 따라 결과는 달라질 수 있는데, 이 '어떻게'를 세밀하게 결정하는 인자들을 매개변수라고 함...알고리즘마다 조절할 수 있는 매개변수는 각각 다름. 복잡한 알고리즘은 매개변수도 복잡함. 연구자는 매개변수를 조절하여 모델을 훈련시킴으로서 가장 성능이 우수한 모델을 찾아낼 수 있음

 

(모델이 일반화)

현실 세계에서 이상적인 기계학습 모델이란 유한한 수의 훈련 케이스로 학습하되 되도록이면 '진리'에 가까운 분류 성능을 내는 모델.....이러한 모델을 일반화가 잘 된 모델이라고 함.

 

(기계학습과 통계학적 방법)

가장 큰 차이점은, 통계학은 어떤 가설이 옳다는 가정을 지지하는 증거를 데이터 집합에서 찾아내는 형식의 알고리즘인 반면, 기계학습은 데이터 집합을 통해 축적된 추상적인 관계 속에서 새롭게 주어지는 데이터를 무엇이라고 판단해야 하는가를 고민하는 알고리즘이라고 할 수 있음

 

(기계학습과 데이터마이닝)

기계학습은 데이터를 해석하거나 정보를 찾아내는 목표뿐만 아니라 어떤 지능적 행위를 하는 것까지를 포함하는 개념이지만, 데이터마이닝의 방법론으로서의 기계학습은 보통 데이터를 해석하는 단계에서 역할을 끝냅니다. 

 

(기계학습이 이루어지는 절차)

(1) 데이터 수집: 전자의무기록(EMR)이나 PACS에서 의무기록을 수집하여 케이스(데이터셋)와 속성을 가진 전자문서로 정리하는 절차....

(2) 데이터 전처리: 데이터가 정확히 기록되었는지 오류는 없는 지, 결측치(null data)는 없는 지 확인....데이터 집합에 전반적인 편향이 있다면 적합하지 않음. 

(3) 알고리즘에 의한 모델 훈련: 데이터나 문제에 가장 적합한 알고리즘을 선택하고 전처리된 데이터를 알고리즘에 입력함. 알고리즘은 데이터들을 읽고 나름의 지식(모델)을 생성함. 알고리즘의 학습 방식을 미세하게 조절하는 매개변수를 결정해야 할 수도 있음

(4) 모델의 성능 측정: ㅇ알고리즘이 학습을 잘 했는지 (즉 모델이 잘 만들어졌는지) 확인하기 위해 모의고사를 치름. 새로운 데이터(평가 예제)를 모델에 입력하여 목적된 과업를 잘 수행하는지 확인함.

(5) 모델 개선: 성능이 만족스럽지 못하면 원인을 찾아 개선. 알고리즘을 변경하여 새로 학습하거나, 훈련용 데이터를 보다 많이 확보하여 추가적 학습을 할 수도 있음

(6) 사용하기: 최적의 모델이 찾아지면 실제 문제를 해결하기 위해 기계학습 모델을 사용함. 

 

편향(bias, b)...b값이 존재하는 이유는 들어오는 데이터가 전혀 없더라도 신경 세포 자체의 기본 전위가 존재하는 생물학적 상황과 유사함.

 

에포크(epoch): 같은 데이터 집합에 대한 훈련 사이클..

 

학습률이 지나치게 낮으면 최적의 가중치를 찾는 데 시간이 길어지고, 반대로 학습률이 너무 높으면 최적의 가중치를 찾이 못할 수도 있다. 

 

[ 자평 ]

 

필요한 부분만 스쳐 읽음.....

읽은 부분은 좋았음...

댓글