티스토리 뷰

728x90

[ 밑줄/연결 ]

 

언어 모델: 자연어 처리 분야에서 사용되는 모델 중 하나로, 주어진 문장(단어)이 주어졌을 때 다음에 나올 문장(단어)를 예측하는 모델

 

(단어를 수치로 표현한다 : 임베딩)

단어 혹은 문장을 숫자로 표현해 주는 것이 임베딩

(컴퓨터와 인간에게 맞는 표현으로 변환한다 : 인코딩과 디코딩)

인코딩 :  컴퓨터에서 문자나 기호를 컴퓨터가 이해할 수 있는 코드(0이나 1)로 변환하는 과정을 의미함

디코딩 :  컴퓨터와 인간이 의사소통하기 위해 필요한 하나의 과정이라고 이해가면 됨

디코딩이란 인코딩된 데이터를 원래의 데이터로 변환하는 과정을 의미함

컴퓨터가 이해할 수 있도록 변환된 0과 1을 다시 인간이 이해할 수 있도록 인간의 언어로 표현하는 과정이라고 이해

 

(트랜스포머, 버트, GPT)

트랜스포머는 인코더와 디코더를 여러 개 사용함

 

트랜스포머는 입력 단어 자체가 하나로 쭉 연결되어서 하나의 입력이 되고, 그에 대한 어텐션 값을 한 번에 구하는 방식을 취함

 

입력 텍스트를 단어별로 쪼개는 것이 아니라, 전체 문장을 한꺼번에 이용하기 때문에 순환신경망을 사용하지 않고도 학습을 진행할 수 있음

인코더의 역할은 입력된 문장을 (예: I'm learning AI)을 학습하는 것이고, 디코더는 인코더의 출력을 사용자가 원하는 문장(예: 나는 AI를 공부하고 있다.)을 생성하는 역할을 한다.

 

 

(생성형 언어 모델, GPT)

 

생성형 언어 모델은 이전에 주어진 단어나 문장을 기반으로 새로운 문장을 생성하는 모델로, 이때 사용되는 알고리즘이 순환신경망이나 순환신경망 장단기 기억임

 

사전학습 모델 : GPT처럼 대규모 데이터를 사용하여 사전 학습된 모델. 사용자들은 API를 이용해서 사용

 

(챗GPT 플러그인)

다른 웹 사이트나 DB 등에 접근할 수 있는 도구

 

(파라미터)

인공지능 모델을 구성하는 요소 중 하나로, 모델이 학습을 통해 자동으로 조정하는 값

 

일반적으로 파라미터는 모델의 가중치(weight)와 편향(bias)  --> 모델의 정확도를 높이기 위해 조정하는 값

 

 

(제로샷 러닝)

추가 학습 없이 챗GPT 모델을 그대로 사용한 상태에서도 새로운 데이터의 분류/예측이 가능한 학습

예) 고양이 강아지 분류 모델  --> 코끼리/사슴 분류 가능.....번역 서비스

 

(퓨샷 러닝)

작은 규모의 데이터를 가지고 있을 때 사용

MRI, CT 등 영상 데이터를 분석하여 환자의 건강 상태를 파악하는 작업

 

 

(파인 튜닝)

 

사전에 학습된 모델을 새로운 데이터로 재학습하여 성능을 개선하는 방법

모델의 성능을 향상 & or 우리만의 데이터를 추가 학습 

 

(1) 사전학습된 모델 선택

모델의 크기, 학습 데이터, 사용 가능한 HW 등을 고려하여 적절한 모델을 선택

<modelname>  :  사용할 모델을 명시함. 

 

 

(2) 파인 튜닝을 위한 데이터 선택

데이터의 크기와 품질이 파인 튜닝에 큰 영향을 미침

 

openai 라이브러리 설치

!pip install --upgrade openai

 

파인 튜닝은 fine-tunes-create 구문으로 구현

 

(3) 파인 튜닝 모델 구성

사전 학습된 모델에서 마지막 계층(출력층)을 제외한 나머지 계층은 그대로 두고, 마지막 계층을 파인 튜닝 작업에 맞게 재구성함 (ex: 노드 수 조정)

마지막 계층의 크기와 구성을 파인 튜닝 작업에 맞게 조절하는 것이 중요함

 

(4) 파인 튜닝 수행

사전 학습된 모델과 파인 튜닝 데이터를 사용하여 모델을 재학습함

에포크(epoch) 수 (전체 학습 데이터를 모델에 통과시키는 횟수)

학습률(learing rate) (모델의 가중치를 업데이트할 때 사용)

배치 크기(batch size) (한번에 모델에 입력하는 데이터의 갯수)

등의 하이퍼파라미터 (모델의 학습시키는 동작 방식을 제어하는 변수들. 사용자기 직접 지정해야 하는 값)

를 조절하여 파인 튜닝 성능을 최적화

 

(5) 모델 평가

파인 튜닝된 모델의 성능을 평가

 

(6) 모델 적용

데이터 품질에 따라 모델의 성능이 달라지기 때문에 선별적인 데이터 준비가 필요

 

 

 

[ 자평 ] '파인 튜닝' 부분이 궁금했는데, 딱 문송이 이해 가능한 수준까지만 잘 써졌다. 

 

20년 넘게 IT 분야에서 일하고 있으며  2023년 4월 책을 낸 약력에는 마이크로소프트에서 Data & AI Specialist로 근무 중이라 한다.

 

의도 않지 않게 저자의 책을 꽤 읽었고, 좋은 인상을 가지고 있다. 

댓글