티스토리 뷰

지능/인공지능

프레디쿠스 by 임영익

비즈붓다 2020. 6. 15. 22:08
728x90

인공지능을 이해하기 위한 최소한의 이야기

국내 최초로 소개되는 인공지능 판사와 예측 기계의 세계

[ 밑줄 ]

 

ㅇ 문제는 언어나 추론 같은 인간의 고등한 지능을 컴퓨터로 구현하자니 무한한 비용과 시간이 들어간다는 것...더 심각한 것은 보고 듣고 움직이는 인간의 아주 기본적인 지능의 활동은 애초 그 규칙을 말로 설명할 수 없다. 이것이 바로 널리 회자되는 '폴라니의 역설' (Polany's Paradox)이다.

 

--> 모라벡의 역설이 아닌가? 애매한 문장이기는 하다...

--> 또한 역사상 유명한 폴라니가 두 명이다. 철학자 마이클 폴라니, 경제학자 칼 폴라니.. 둘 다 비슷한 말을 해서 더 헷갈린다. 도대체 어느 폴라니가 말한 역설인지?? 

--> 철학자 마이클 폴라니(Michael Polanyi)가 말한 폴라니의 역설(Polanyi’s Paradox)은 '우리는 우리가 말할 수 있는 것보다 많이 알고 있다'는 것이다. 그래서 기계에게 지식을 전달하는 우리의 능력도 심대한 제약이 되어왔다는 주장 이다.

--> 경제학자 칼 폴라니 역시 `인간이 오랫동안 체화한 암묵적 추상적 지식은 컴퓨터나 기계로 대체할 수 없다`는 `폴라니 역설(Polanyi`s Paradox)`을 주장해 이러한 기술 진보 현상을 더욱 강력하게 뒷받침했다.

 

ㅇ 알파고의 등장은 딥러닝이 폴라니의 역설을 돌파했다는 상징적 의미를 가지고 있다. 우리 인간이 암묵지의 형태로 지식을 습득하면서 지능이 향상하듯이 이제 컴퓨터는 데이터를 통해서 스스로 학습을 하면서 세상의 규칙을 이해할 수 있다. 인간이 모든 규칙을 손수 컴퓨터에 가르치는 성가신 작업이 사라지는 순간이다. 아기가 말문이 터진 것처럼 딥러닝은 이제 알아서 암묵지를 형성해 나간다...

 

--> 전반적으로 맞는 말이다... 하지만 '알아서'라는 부분은 오해가 있을 수 있다.

--> 빅 데이터를 보정하느라, 정제하느라 며칠 밤을 세거나 모델을 수도 없이 튜링하는 데이터 과학자들의 노고를 너무 쉽게 퉁 치는 것이다. 솔직히 내가 옆에서 볼 때 아직은 '알아서'는 아는 것 같다. 

 

ㅇ 예측지능은 자연의 본질이다. 따라서 인공지능이 자연지능을 모방할수록 예측지능의 속성은 점점 강해질 수 밖에 없다. 컴퓨터를 기반으로 하는 기계적 예측지능은 속도나 효율성 면에서 인간지능과는 비교가 안된다.

 

--> OK..이 부분은 기술적 측면도 좋지만 경제적 측면에서 인공지능의 예측 능력의 의미를 기술한 '예측기계'가 유용하겠다. 또한 예측이 얼마나 비즈니스에서 중요한 역량인가를 알게 해주는 '슈퍼 예측: 그들은 어떻게 미래를 보았는가?'도 좋은 참고가 된다.

 

 

--> 그러나, 균형감을 유지하기 위해 아래의 책도 읽어 보기를 권한다. 예측이라는 것이 인간의 불안한 심리를 자극하는 얼마나 교묘하게 큰 시장인지.... (당연히 책 중 99.99%는 예측의 중요성, 방법, 비법은 알려 준다는 책이다...돈이 되니까..)

--> 특히 '욕망을 파는 사람들' 중 2장/3장/5장 (경제/경영/기술예측)이라도 참고 했으면 좋겠다. 

 

ㅇ 뉴턴의 위대한 이론에 물체의 위치와 속도를 예측하는 기능이 있듯이 기본적으로 과학은 예측 기능을 가지고 있다. 이것은 과학뿐만 아니라 대부분 학문의 공통적 속성이며 예측 욕망의 결과물이다. 예측 욕망은 다분히 인간적인 것이지만 DNA에 숨어 있는 오래된 본능이다.

 

--> 딴지를 걸고 싶지 않지만 일부 동의하고 일부 동의하지 않는다.

--> 예측은 본능이다. 동의.. 생물의 생존에 유리하기 때문에 뇌가 탄생/발달했고 같은 뇌라도 예측 능력이 좋은 뇌가 셍존에 유리할 것라라는 추정으로.....

--> 예측은 (현재 수준에선 인간의) 모든 학문의 공통적 속성이 아니라 공통적 욕망이라고 본다. 하지만 모든 학문의 현재 예측 능력은 형편없다고 본다. 다만 좋은 학문은 예측이 아니라 이제 겨우 발생한 현상을 (사후) 설명한다. 

 

ㅇ  뇌는 움직임을 예측하는 시스템이다. 움직임이 없는 식물은 이런 의미에서 뇌라는 것이 필요없는 것이다.

 

ㅇ  어른이 된 명게는 골치 아프게 예측할 필요없이 한 곳에서 그냥 조용히 살면 된다. 멍게의 인생을 보고 뇌의 존재 이유를 따지는 것도 이상하지만 뇌는 그런 속성이 있다.

 

ㅇ 우리는 마우스를 단번에 알아본다. 우리 뇌는 모든 마우스의 모습을 기억하는 것이 아니고 불변적 패턴을 통해 그렇게 짐작하는 것이다.

 

패턴 인식과 예측은 동전의 양면관계 정도로 받아들이고.....

 

ㅇ 인지과학자 마크 창기지(Mark Changizi)는 '예측적 지각'이라는 독특한 가설을 제시했다 우리의 시각 시스템은 과거의 정보를 바탕으로 0.1초 이후의 상황을 예측하여 미리 예상 이미지를 생성하는 방향으로 진화했다고 한다. 창지기는 그 유명한 해링착시(Hering illusin)을 예측기의 작동으로 설명한다.....우리의 뇌가 검정 창살을 보고 관찰자가 전진하고 있다고 해석하는 동시에 우리는 수직선이 뒤로 물러난다고 느끼게 된다... 우리의 뇌가 부지불식간에 상황을 예측하고 예측해버리면서 현실과 부조화를 이루기 때문에 헤링착시가 발생한다고 본다....

 

ㅇ 미래 예측을 위해 모든 신경은 동시다발적으로 협동을 하면서 저장된 기억을 이용하여 예측적으로 시나리오를 순간순간 만들어낸다.

 

ㅇ 결국 예측 욕망은 본능이자 지능이며 그것이 바로 예측 알고리즘을 만들어내는 발전기이다.

 

ㅇ 약 인공지능은 지금 우리가 보는 인공지능이며 어떤 특정한 한 가지 분야의 주어진 일을 인간의 지식에 따라 수행하는 인공지능이다. 강 인공지능은 이와 대비되는 개념으로 자율성이나 의식을 가진 인공지능이다.

 

ㅇ 1956년 미국  다트머스 대학교에서 여러 학자가 모인 인공지능 컨퍼런가 열렸다......기획한 학자는 수학자 존 매카시(John McCarthy)였다.....이후 기호주의 인공지능(Symbolic Artificial Intelligence)이라는 방법론 크게 융성하게 된다....추론, 탐색, 문제해결 등 분야에서 형식논리와 기호체계에 기초한 연구법을 지칭한다. 쉽게 말하면 세상의 문제를 수학처럼 기호와 규칙을 통해 풀려고 접근법이다. 

ㅇ 인공 지능은 연구방법론을 기준으로 두 가지로 나뉨

- 규칙 기반 인공지능 : 기호주의, 추론탐색, 전문가 시스템

- 학습 기반 인공지능 : 의사결정 나무, 인공신경망, 서포트 벡터머신

 

ㅇ 인공지능의 역사는 지능을 기계적 계산 과정으로 설명할 수 있다는 '계산주의' 철학을 기반으로 출발했다. 계산을 수행하려면 계산 과정을 정의하는 기호(symbol)과 기호 간 연산에 대한 규칙(rule)을 정의해야 하기 때문에 자연스럽게 규칙 기반 인공지능이라는 개념이 도출됐다. 계산주의, 기호주의, 규칙 기반 같은 단어들은 거의 같은 의미로 사용된다. 전문가 시스템도 결국 지식을 규칙으로 표현하는 것이 핵심이므로 규칙 기반의 일종으로 본다. 

 

ㅇ 파이겐바움과 전문가 시스템

- 현재 우리가 보는 지식을 처리하는 대부분의 시스템은 파이겐바움이 만든 개념을 바탕으로 한다. 

- 인공지능 의사, 인공지능 변호사, 인공지능 분석사, 인공지능 과학자 같은 것들은 모두 전문가 시스템이며 IBM 왓슨도 전문가 시스템의 후예다.

 

ㅇ 법률가들은 규칙 덩어리를 가지고 그 규칙에 따라 연역적 추론을 하는 것처럼 보인다.

 

ㅇ 형식적으로나마 인간의 인지 과정을 모방한다고 하여도 지식을 추출하고 규칙을 입력하는 것은 결국 인간이 해야 하기 때문에 무한한 시간과 비용의 문제를 극복할 수 없다. 이것은 인공지능 구현에 '학습' 개념이 절대적으로 필요하다는 것을 암시하고 있다.

 

ㅇ 전문가 시스템은 인간의 지식을 잘 표현하는 것이 핵심이다....지식의 의미를 잡아내기 위해 또 다른 지식의 표현이 필요한데 이런 식으로 계속 연결하다 보면 상식 수준의 지식이 등장하게 된다.

 

'생각이 알고리즘이며 알고리즘이 곧 생각' 이라는 'Compution 철학'이 일종의 패러다임으로 작동하고 있다...

 

ㅇ 1957년 프랭크 로젠블라트(Frank Roseblatt)는 세계 최초로 퍼셉트론(Perceptron이라는 인공신경망 시스템을 개발했다....1940년대 맥클록(McCulloch)과 피츠(Pitts)가 발표한 인공신경망 모델을 컴퓨터로 실제 구현한 시스템이다.

 

ㅇ 마빈 민스키는 '퍼셉트론즈 Perceptrons' 라는 책을 통해 단층 신경망인 퍼셉트론은 단순한 선형분류기에 불과하며 XOR 같은 비선형 문제를 풀 수 없음을 발표했다......퍼셉트론이 가지는 본질적인 한계를 수학적으로 증명한 것....

ㅇ  머신러닝의 발전 흐름도

- 1980년대 이후 오차역전파(back-propagation)방법이 등장하면서 다층 구조의 신경망 학습 알고리즘은 획기적으로 개선 됐다...

ㅇ 학습 기반 인공지능을 머신러닝(Machine Learning/기계학습)이라 부르며 데이터를 통해 학습한다는 의미에서 기호주의나 규칙 기반 인공지능과는 다른 방법론이다.

 

ㅇ 인공신경망은 다른 머신러닝 모델과 달리 시스템 구현에 대한 높은 자유도를 가지고 있기 때문에 활용도가 매우 높다. 특히 은닉층이 있는 신경망은 어떤 함수라도 근사적인 모방을 할 수 있다. 이런 점에서 만능근사기(universal Approximator)라고 부른다.

 

ㅇ 인공신경망(ANN, Artificial Neural Net)은 말 그대로 인간의 신경망을 모방한 알고리즘이다. 

ㅇ 데이터를 입력받아서 학습한다는 것은 노드와 노드를 연결하는 연결선의 가중치를 변화시키면서 최종 응답(출력)의 오류를 최소화하는 과정이다. 학습이 끝나면 이 가중치가 특정 수치로 결정된다.

 

ㅇ 머신러닝이 하는 일은 일반적으로 회귀(regression), 분류(classification), 군집(clustering)으로 나눌 수 있다. 회귀와 분류는 보통 지도학습 방식

- 회귀: 연속적인 변수와 출력을 대상으로 하는 것....키와 몸무게 관계를 함수로 표현하기... 관계함수에 어떤 인물이 몸무게를 입력하면 자동으로 키를 출력한다. 머신러닝은 학습을 통해 이 관계 함ㅅ를 자동으로 찾아주는 알고리짐이다. 

- 분류: 이것이냐, 저것이냐? , 주식이 오르냐? 내리냐? 스팸이냐? 정상메일이냐? 

- 군집: 라벨링이 필요 없는 비지도학습...데이터의 특징에 따라 유사한 것끼리 묶는 작업

 

ㅇ 머신러닝은 대부분 분류 알고리즘으로 작동한다......머신러닝은 분류기다..

 

ㅇ 머신러닝이 학습을 한다는 것은 분류기를 사람이 직접 프로그램해서 만들 필요가 없이 데이터를 통해 자동으로 만든다는 의미이다.....머신러닝은 모델 학습 과정과 최종 모델을 가지고 예측하는 단계로 구별할 수 있다. 아래 파란색 점선 부분이 모델을 학습하는 과정....학습으로 최적화된 최종 모델(붉은 색)이 바로 우리가 목표한 분류기이며 예측 함수가 된다. 이제 새로운 미지의 데이터를 입력하면 (즉, 정답/라벨이 없는 데이터) 뷴류기가 그 데이터를 분류한다.

 

ㅇ 아파트 가격을 예측하는 예측 함수를 만들 때 아파트 가격에 영향을 주는 주요 피처는 무엇일까? 평수, 위치, 층수, 일조량, 단지수, 브랜드, 학군 등 등........컴퓨터가 자연스럽게 데이터만 주면 피처(특징)을 잡아주는 시스템...

 

ㅇ 딥러닝은 피처(입력값)을 스스로 생성해낸다....엄청난 양의 데이터를 학습하여 스스로 피처를 만들고 인간이 식별하지 못한 특징도 찾아낸다...이런 의미에서 딥러닝을 표현학습 혹은 특징학습이라고 한다.

 

ㅇ  딥러닝은 입력 데이터에서 스스로 피처를 찾아내고 그것을 입력값으로 변환하여 다시 분류기로 넘기는 작업을 수행한다....딥러닝은 피처를 스스로 생성한다. (특징학습)

 

ㅇ 컨볼루션 신경망은 실제 인간의 눈이 사물을 지각하는 것을 모방한 것이다...

ㅇ 중간 계층에 있는 세포는 하위층에 있는 여러 세포들이 보내는 패턴을 종합한다.

 

ㅇ 컨볼루션 신경망은 이미지의 특징이나 피처를 잡아내는 필터의 집합체이다. 단계별로 나누어진 필터는 사물의 피처를 잘 잡아낼 수 있도록 학습을 통해 최적화된다. 피카소가 사물의 피처를 멋지게 잡아내서 표현하는 것처럼 기계는 학습을 통해 사물의 피처를 이해하는 것이다.

 

ㅇ 순환신경망은 순차적인 정보나 시간이 개입된 정보를 처리할 수 있도록 신경망을 재구성한 것..

ㅇ 처음에는 아무 정보도 없는 상태에서 시작하여 재판 과정에서 하나씩 등장하는 증거들을 보면서 유죄의 심증이 형성되는 판사의 의사결정 과정을 베이즈 추론 혹은 베이즈 확률 기법으로 설명한다.

 

ㅇ 인공 지능을 모듈로 나누어서 해석하게 되면 좀 더 정확하게 인공지능의 실상을 이해할 수 있다... 시각지능, 언어지능, 추론지능 같이 인간을 기준으로 기능적으로 특화된 지능 모듈을 구현하는 인공지능을 지능 모듈(intelligent module)이라고 불러보자..

 

ㅇ 일반적으로 예측은 '다음 상황'을 예상하거나 '미리 추측'하는 시간적 개념을 가정한다...그러나 논리관계나 함수관계에서도 예측이라는 말을 가져올 수 있다.

 

ㅇ 컴퓨터와 인간의 차이는 너무나 많아서 모두 설명하기 힘들지만 가장 중요한 차이는 지능의 메타성이다. 우리 인간의 지능은 스스로 확장되는 메타적 성격을 가지고 있다. meta는 어떤 대상을 전제로 그 대상의 상위 대상을 지칭하는 것이다. ....메타기억은 기억에 대한 기억 혹은 기억 위의 기억이다.....우리의 뇌는 무엇을 기억할 때 '기억을 했다'는 그 자체도 기억하는 것이다.....메타기억은 어떤 기억이 있는지 없는지 자체에 대한 기억이다....

 

ㅇ  메타 인지(meta-cognition)은 자신에 대해 생각하고 성찰하고 반성하는 능력이다. ...추상적인 메타 인지는 메타 생각으로 확장된다. 메타 생각은 메타 인지를 기반으로 하여 메타적 지식(패턴 위에 패턴)을 만들고 응용하는 능력을 포함한다....'메타'는 어떤 대상을 전제로 그 대상의 상위적 대상을 만들어내는 역할을 한다. 이런 특징 때문에 메타는 항상 재귀성(recursivenesss)이 숨어 있다. 재귀성은 자신을 다시 인용하거나 호출한다는 의미이다. 자신의 생각에 대해 다시 생각하거나 자신을 성찰하는 자기 인식도 재귀성을 기반으로 한다. 

 

ㅇ 상호작용적 메타 생각의 원형은 '마음이론'이다. 

 

 

[ 연결 ]

 

저자의 책은 2014년에 출판된 '메타생각'으로 처음 접한 것 같다.

당시 변호사가 '창의성'과 관련한 책을 쓴 다는 것이 흥미로웠다.

‘자신이 생각하는 것을 다시 생각하는 것’이라는 개념이 메타인지(meta-cognition)이다.

저자는 뇌과학, 심리학, 인지과학, 수학을 모두 융합하여 글을 써 냈다.

 

법률 분야에 AI, IoT 등 기술 적용사례에 대한 책은 얼마 없다

저자 약력도 없는 일본인이 쓴 리걸테트(Legal Tech) (2018년) 정도만 본 것 같다.

 

 

 

[ 자평 ] 한 번을 읽을 필요가 있는... 문장 기술과 그림 편집이 깔끔한 책....

 

잘썼다... 초보자가 보기에는 깔끔하게 정리가 되었다.

글의 설명이 깔끔하고  특히나 설명을 돕는 그림도 깨끗하다.

잘 쓰고 잘 편집한 책이다.

 

무엇보다도 장 끝에 있는 기술적으로 추가 설명을 한 '박스'란이 좋았다. 

심층신경망, 컨볼루션 신경망, 순환 신경망을 간단하고 쉽게 설명해 준 부분이 도움이 되었다. 

 

다만 9장 메타 인공지능은 다른 자료를 좀 더 살펴 봐야 겠다. 

내 경험과 지식이 부족하여 저자의 생각을 따라 가지 못했다. 

 

메타 인지, 메타 사고, 메타 생각... 등 등 

거의 모두 교육학 쪽 책들 밖에 없어.. 웬지 이런 단어가 과학적이 아닌 상술의 냄새가 난다...

 

댓글