더북(TheBook)

LESSON 01
분석 과정

분석은 다음과 같은 순서로 진행한다.

 

head()tail()로 데이터 미리 보기

정규표현식으로 데이터 전처리, 불용어 제거하기

판다스의 info(), describe()로 데이터 요약하기

청원 기간 구하기

플롯나인으로 다양하게 시각화하기

KoNLPy와 soynlp로 토큰화하기, 명사 추출하기, 워드클라우드 그리기

판다스로 투표수 구하기

TF-IDF 단어 벡터화 및 가중치 적용하기

학습(fit), 예측(predict), 평가(evaluate)

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.