더북(TheBook)

훨씬 간단하고 보기 좋은 결과가 나왔습니다. 쿼리 12-10은 연대를 10년 단위로 분할하는 CASE에서 THEN 절에 연대가 아닌 사고 건수(total_acct_num)를 사용했습니다. 1980~2010년대를 컬럼 형태로 만들어야 하므로 총 4개의 CASE 표현식을 사용했고, 각 CASE 전체를 SUM 함수로 감싸서 총 사고 건수를 집계했습니다. CASE 표현식의 별칭을 “ ”로 감싼 이유는 별칭 역시 숫자로 시작할 수는 없기 때문입니다(3.4절 참조).

그림 12-7을 보면 여러 정보를 알 수 있습니다. 일단 2000년대에 와서 사고가 점차 줄어드는 추세이고, 자동차의 경우 1990년대에 가장 사고가 많았군요. 1980년대 사고 건수가 1990년대보다 적은 이유는 상대적으로 1980년대가 1990년대보다 자동차 운행 수나 자동차 보유 수가 적었기 때문임을 유추할 수 있습니다. 항공기의 경우 사고가 늘어나는 추세인데, 항공기 사용이 늘어남에 따라 사고가 늘어난 것 같군요(선박 역시 마찬가지입니다). 이렇듯 어떤 식으로 쿼리를 작성하느냐에 따라 단순한 데이터에서 의미 있는 정보를 추출해 낼 수 있습니다. CASE 표현식에서 total_acct_num 대신 death_person_num 컬럼을 사용하면 사망자 수 추이도 볼 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.