동일한 내용을 파이썬으로 구현하는 방법을 알아봅시다. 실습에는 표 14-3과 같은 데이터셋을 사용합니다.
num |
label |
text |
label_num |
1 |
spam |
your free lottery |
1 |
2 |
spam |
free lottery free you |
1 |
3 |
ham |
your free apple |
0 |
4 |
ham |
free to contact me |
0 |
5 |
ham |
I won award |
0 |
6 |
spam |
my lottery ticket |
1 |
표 14-3 | 사용할 데이터셋
베이지안 확률 예제를 실습하기 전에 먼저 아나콘다 프롬프트에서 다음 라이브러리를 설치합니다.
> pip install pandas 또는 conda install pandas > pip install scikit-learn 또는 conda install scikit-learn > pip install nltk 또는 conda install nltk > import nltk 또는 conda install nltk > nltk.download()