더북(TheBook)

동일한 내용을 파이썬으로 구현하는 방법을 알아봅시다. 실습에는 표 14-3과 같은 데이터셋을 사용합니다.

 

num

label

text

label_num

1

spam

your free lottery

1

2

spam

free lottery free you

1

3

ham

your free apple

0

4

ham

free to contact me

0

5

ham

I won award

0

6

spam

my lottery ticket

1

표 14-3 | 사용할 데이터셋

 

베이지안 확률 예제를 실습하기 전에 먼저 아나콘다 프롬프트에서 다음 라이브러리를 설치합니다.

 

> pip install pandas       또는 conda install pandas
> pip install scikit-learn 또는 conda install scikit-learn
> pip install nltk         또는 conda install nltk
> import nltk              또는 conda install nltk
> nltk.download()
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.