LESSON 01
분석 과정
분석은 다음과 같은 순서로 진행한다.
• head()와 tail()로 데이터 미리 보기
• 정규표현식으로 데이터 전처리, 불용어 제거하기
• 판다스의 info(), describe()로 데이터 요약하기
• 청원 기간 구하기
• 플롯나인으로 다양하게 시각화하기
• KoNLPy와 soynlp로 토큰화하기, 명사 추출하기, 워드클라우드 그리기
• 판다스로 투표수 구하기
• TF-IDF 단어 벡터화 및 가중치 적용하기
• 학습(fit), 예측(predict), 평가(evaluate)