더북(TheBook)

정형(구조화, structured) 데이터는 구조와 관리 체계에 규칙이 정해져 있는 데이터를 말합니다. 책에서 다루는 오라클 데이터베이스는 이러한 정형 데이터를 다루는 관계형 데이터베이스 시스템(RDBMS)에 속합니다. 이어서 배우겠지만 기업에서는 안정성 때문에 관계형 데이터베이스를 많이 사용합니다. SQL은 정형 데이터로 만들어진 관계형 데이터베이스를 조작하는 언어입니다.

비정형 데이터는 정형 데이터에 상반되는 개념입니다. 비정형 데이터는 최근 빅데이터가 주목을 받기 시작하면서 부각된 데이터 형태인데, 정형 데이터 외의 모든 데이터가 비정형 데이터입니다. 이를테면 이메일 내용과 소셜미디어 포스트, 각종 텍스트 문서, 음원과 이미지, 스마트폰에 기록되는 각종 행동 정보와 기계에서 출력되는 각종 메시지와 로그(log, 기록)2등을 말합니다.

책에서는 정형 데이터, 관계형 데이터베이스 중 하나인 오라클을 다루려 합니다.

 

그림 1-9 빅데이터와 정형 데이터의 영역

 


2 로그는 엄밀하게 말하면 정형과 비정형의 중간 형태인 반정형(semi-structured) 데이터지만 편의상 비정형 데이터로 구분하겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.