티스토리 뷰

728x90

[ 밑줄/연결 ] 

 

문제를 해결하려면 해당 데이터포인트를 제거하고 시스템을 완전히 다시 학습시켜야 했다. 

 

좋은 골디락스 문제의 특징은 같은 문제를 해결한 과거 사례 데이터가 많이 축적되어 있다는 것이다. 

 

새로운 팀의 구성원은 제품 담당자, 디자이너, 머신러닝 담당자 한 명씩과 프론트엔드 개발자와 백엔드 개발자였다.

 

제일 먼저 채용되거나 팀에 영입해야 하는 사람은 제품 매니저나 비즈니스 분석가처럼 비즈니스 문제를 깊이 이해할 수 있는 사람이다. 팀의 계획을 관리하고 가치 창출을 이끄는 사람이다. 

 

다음으로 팀에 합류해야 할 사람은 데이터 과학자다. 제품 매니저와 협력하여 비즈니스 문제를 머신러닝 문제 해결 프레임워크와 연결할 수 있다. 

 

DevOps 인력을 팀에 포함시켜 AI모델을 운영, 배포, 유지할 수 있는 도구를 관리해야 한다. 

 

(AI모델을 현장에 적용할 때 중요하게 고려해야 할 세 가지 사항)

(가용성)

ㅇ 업그레이드나 배포 중에 중단되는 서비스가 없도록 해야 함

(성능)

ㅇ 충분히 빨리 응답하는지 확인해야 함

ㅇ 월마트는 페이지 로드 시간이 1초 향상될 때마다 사용자 전환율이 2% 늘어난다는 것을 발견했다.

(확장성)

ㅇ 현재 트래픽을 얼마나 처리할 수 있는가? 

 

성공적인 AI시스템을 구축하려면 다음과 같은 기술적인 구성요소도 필요하다.

 

(데이터 수집과 레이블링 플랫폼)

ㅇ 학습 데이터를 수집하고 주석을 입력하기 위해 사용하는 플랫폼

 

(학습 데이터 관리 플랫폼)

ㅇ 모든 학습 데이터를 보관하고 관리하는 플랫폼

ㅇ 데이터 레이크(가공되지 않은 상태로 저장되어 접근이 가능한 엄청난 양의 데이터)와 데이터 웨어하우스의 일부이거나 이와 밀접하게 통합되어 있다. 

 

(머신러닝 학습 플랫폼)

ㅇ 머신러닝 모델을 학습하고 디버그하는 플랫폼

텐서플론 파이토치 같은 프레임워크나 도구를 사용할 수 있고, 학습 데이터 관리 플랫폼과 연결하여 데이터를 도구에 공급하고 모델을 디버그하고 오프라인으로 모델 검증을 할 수 있다. 

 

(머신러닝 추론 플랫폼)

ㅇ 머신러닝 모델을 배포하고 예측 작업을 수행하는 플랫폼

ㅇ 다른 Appl.과 실시간 API 호출을 통해 상호작용할 수 있는 환경일 수도 있고 운영 담당자가 비실시간으로 배치 작업을 하는 환경일 수 있다. 

 

(특성 저장소)

ㅇ 머신러닝 모델이 실시간 특성 데이터를 받아 이를 입력값으로 모델 예측을 수행하는 장소

 

(ML옵스 시스템)

ㅇ 데브옵스팀이 모델을 배고하고 갱신하거나 모델 성능을 모니터링할 때 사용하는 시스템

 

 

[ 자평 ]  음. 뭐 간단히 휘리릭....

 

 

댓글