더북(TheBook)

12.2.3 데이터 분석하기

여기서 데이터를 분석할 대상은 원천 데이터가 들어 있는 titanic_data 테이블이 아니라 데이터 정제 과정을 거친 titanic 테이블입니다.

 

성별 생존자 수와 사망자 수의 비율 조회하기

먼저 타이타닉 탑승자의 성별로 생존자 수와 사망자 수를 구해 봅시다. 성별은 gender, 생존과 사망 여부는 survived 칼럼을 참조하면 됩니다. 그렇다면 생존자 수와 사망자 수는 어떻게 가져올까요? titanic 테이블에는 1개 로우에 탑승자 1명의 정보가 저장되어 있습니다. 따라서 인원수는 로우 수입니다. titanic 테이블의 총 로우 수는 1,309건이므로 1,309명이 탑승했다는 뜻입니다. 쿼리를 작성해 봅시다.

코드 12-23

SELECT gender, survived, COUNT(*)
  FROM titanic
 GROUP BY gender, survived
 ORDER BY gender, survived ;

실행결과

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.