판다스의 read_csv()로 ‘topic’을 확인해 보자. 뉴스 타이틀이 정치, 경제 등의 범주 중 어디에 속하는지를 토픽 분류 문제로 다룰 예정이다.
# 토픽을 불러온다. topic = pd.read_csv(os.path.join(base_path, "topic_dict.csv")) topic
실행 결과
topic |
topic_idx |
|
0 |
IT과학 |
0 |
1 |
경제 |
1 |
2 |
사회 |
2 |
3 |
생활문화 |
3 |
4 |
세계 |
4 |
5 |
스포츠 |
5 |
6 |
정치 |
6 |