더북(TheBook)

그런 다음 value_counts()로 동일한 값을 모두 더한 결과를 확인해 보자.

petitions['duration'].value_counts()

실행 결과

30 days     366556
90 days      6754
7 days       2436
15 days      1204
60 days       806

 

청원 기간은 기간별로 30일이 가장 많고 90일, 7일 순으로 많다. 청원 기간이 90일이고 답변 대상인 건에는 어떤 청원이 있는지 살펴보자. 연산을 통해 값을 비교하면 결과가 True, False로 나오는데 이 결과를 데이터 프레임으로 다시 감싸면 True로 된 행만 가져온다. 이 방법은 True 또는 False로 나오는 bool 값으로 결괏값을 색인해 오기 때문에, boolean Indexing이라고도 한다.

petitions[(petitions['duration'] == '90 days') & (petitions['answer'] == 1)]
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.