평균이 5,674인데, 21번의 votes_pos_neg 값은 11,293으로 더 높게 나왔다. 추가로 분석한다면 중위수로 해 보는 것도 의미가 있을 것이다.
더 구체적인 내용을 보기 위해 인덱스의 번호를 넣어 내용을 확인해 보자. 내용을 확인하면 전처리 방식 등에 대한 힌트를 얻을 수 있으므로 여러 번 샘플을 보는 것이 좋다.
# 샘플로 보고 싶은 인덱스의 번호를 넣자. sample_index = 13 sample_title = df.loc[sample_index, 'title'] sample_title
실행 결과
『국가유공자 등 예우 및 지원에 관한법률』상「6.25전몰군경 자녀수당」의 불합리한 문제점 개선 청원
sample_content = petitions.loc[sample_index, 'content'] sample_content
실행 결과
(현황)\\n우리들 아버지께서는 67여년전 북의 남침으로 조국이 위기에 처했을 때 젊은 목숨을 바쳐 대한민국을 지켜내는데 헌신했습니다. 우리들 대부분의 아버님들 중 12만위는 전쟁 후 지금껏 유해도 수습 못했고 忌日도 제대로 알지 못하지만 오직 국가유공자의 자녀라는 자긍심으로 [후략]