더북(TheBook)

6장

 

  1 국민청원은 2022년 5월에 폐지됐고, 2022년 6월부터 국민제안 서비스가 운영 중이다. (https://www.epeople.go.kr/nep/withpeople/index.npaid)

 

 

 

  4 기본적으로 수치 데이터에 대한 요약을 보여 주며, object 형식에 대한 데이터의 요약도 볼 수 있다.

 

  5 판다스는 숫자의 길이가 길어지면 효율적으로 표현하기 위해 과학적 표기법을 사용해 출력한다.

 

  6 pd.pivot_table?와 같은 방법으로 공식 문서를 통한 매개 변수 사용법을 확인할 수 있다.

 

  7 %config InlineBackend.figure_format = 'retina' 이 설정은 디스플레이가 retina를 지원하면 폰트를 선명하게 표시해 준다. 지원하지 않는 장비를 사용했을 때는 차이가 없다.

 

 

  9 Soynlp를 더 자세히 알고 싶다면 다음 링크를 참고할 수 있다(https://github.com/lovit/soynlp). 관련 발표는 PyCon Korea의 ‘김현중: 노가다 없는 텍스트 분석을 위한 한국어 NLP’에서 참고할 수 있다(https://www.youtube.com/watch?v=dxkbvZmbLWc&t=5s).

 

10 LRNounExtractor를 더 자세히 알고 싶다면 튜토리얼을 참고하기 바란다(https://github.com/lovit/soynlp/blob/master/tutorials/nounextractor-v1_usage.ipynb).

 

11 참고로 이 절의 머신러닝 진행 과정은 사이킷런을 개발한 안드레아스 뮐러(Andreas C. Müller)의 ODSCON 발표자료(https://github.com/amueller/odscon-2015/blob/master/machine-learning-with-scikit-learn-odscon-expanded.pdf)에서 영감을 받아서 만들었으며 현재는 공식 문서에도 해당 내용으로 설명되어 있다.

 

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.