더북(TheBook)

빅데이터를 구축할 수 있는 가장 대표적인 오픈 소스는 바로 Hadoop입니다. 그림 1-39는 Hadoop과 Hadoop을 둘러싼 에코 시스템입니다. 로그를 수집하는 Flume, 수집한 로그나 데이터를 저장하는 Hadoop HDFS, 코디네이션을 하는 Zookeeper, 데이터 추출을 하는 MapReduce, NoSQL에서 기존 RDBMS의 쿼리(Query)를 그대로 사용하려고 도와주는 Hive 등 정말 많은 에코 시스템이 있습니다. 또 오픈스택에는 이런 빅데이터 자원을 수집하고 분석하는 시스템인 Hadoop, Spark, Storm 같은 에코 시스템을 쉽게 배포할 수 있는 Sahara 프로젝트가 주노(Juno) 버전에서 릴리스되었습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.