
[ 밑줄/연결 ] 빅데이터의 취급이 어려운 이유는 (1) 데이터의 분석 방법을 모른다는 점 (2) 데이터 처리에 수고와 시간이 걸린다는 점 Hadoop: 다수의 컴퓨터에서 대량의 데이터를 처리하기 위한 시스템. NoSQL: 빈번한 읽기/쓰기 및 분산 처리가 강점 Spark: 새로운 분산 시스템 프레임워크. MapReduce보다 효율적으로 데이터 처리를 할 수 있음. 실시간 데이터 처리를 위한 시스템도 다수 만들어 지고 있음 (데이터 파이프라인) : 데이터 수집에서 workflow 관리까지 (데이터 수집): bulk형과 streaming형의 데이터 전송 여러 장소에서 발생하고 각각 다른 형태를 보임. 전송 방식에는 크게 두 가지 ㅇ 벌크형: 이미 어딘가에 존재하는 데이터를 정리해 추출. DB나 서버 등에서..
IT
2021. 5. 2. 10:19
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 이노베이션
- 샤룩 칸
- 복잡계의 새로운 접근
- 인식론
- 머신러닝 디자인 패턴
- 게티어
- 부정성 편향
- Ai
- 돈
- 최진석
- 불교
- 게티어 문제
- 스케일의 법칙
- 디지털 트랜스포메이션 엔진
- 데브옵스 도입 전략
- 파괴적 혁신
- 사회물리학
- 고도를 기다리며
- 지식론
- 참을 수 없는 존재의 가벼움
- 혁신
- 인공지능
- 직감하는 양자역학
- 개념
- 상대성이론
- 당신은 AI를 개발하게 된다
- 양자역학
- 경영혁신
- 개발자가 아니더라도
- 안나 카레니나
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함