더북(TheBook)

1.1.3 3단계: 데이터 전처리와 분석

데이터 분석의 세 번째 단계는 데이터 추출 후 분석 순서로 진행됩니다.

 

1. 데이터베이스에서 조건에 맞는 데이터 추출하기

데이터베이스에 저장된 대량의 데이터 중 필요한 정보만 추출해 분석에 사용하는 것이 중요합니다. 이를 위해 다음과 같은 작업을 수행합니다.

필터링: 조건에 따라 데이터를 선별해 가져오기( 특정 날짜 범위의 거래 데이터만 추출하기)

집계: 데이터를 그룹화하거나 요약하기( 월별 매출 합계 계산하기)

조인(Join): 여러 테이블에서 데이터를 결합해 필요한 정보 통합하기( 고객 정보와 주문 데이터를 결합해 분석하기)

데이터베이스에서 데이터를 효율적으로 추출하면 분석 과정에서 필요한 시간을 단축하고 더 정교한 결과를 얻을 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.