
[ 밑줄/연결 ] (LLM 생성 과정) : 모델 개발을 위한 라이프사이클(1) 데이터 수집과 준비ㅇ 데이터를 수집하고, 가공ㅇ 데이터 수집, 정제, 전처리, 데이터 형식 변경ㅇ 데이터 수집 : 식별, 수집(HTML, 페이지, PDF, TxT, DB 등)ㅇ 데이터 정제 : 중복 제거, 노이즈 제거(오타, 잘못된 문장 부호, 비정상적인 문자 등)ㅇ 데이터 전처리 : 토큰화, 정규화(대소문자 통일, 어간 추출 등)ㅇ 데이터 형식 변경 : 날짜 --> YYYY-MM-DD형으로 변환 등 (2) 모델 설계ㅇ LLM은 주로 트랜스포머 모델을 기반으로 함ㅇ 계층 수, 학습률, 배치 크기 등 모델의 학습 과정을 조절할 하이퍼파라미터를 설정ㅇ 하이퍼파라미터는 학습 과정을 제어하는 데 사용하는 설정 값 --> 모델이 데이터..
IT
2024. 5. 19. 14:48
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 직감하는 양자역학
- 머신러닝 디자인 패턴
- 고도를 기다리며
- 인식론
- 디지털 트랜스포메이션 엔진
- 데브옵스 도입 전략
- 최진석
- 스케일의 법칙
- Ai
- 지식론
- 부정성 편향
- 게티어 문제
- 샤룩 칸
- 양자역학
- 혁신
- 경영혁신
- 상대성이론
- 이노베이션
- 개념
- 파괴적 혁신
- 인공지능
- 게티어
- 돈
- 당신은 AI를 개발하게 된다
- 복잡계의 새로운 접근
- 안나 카레니나
- 개발자가 아니더라도
- 사회물리학
- 불교
- 참을 수 없는 존재의 가벼움
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함