더북(TheBook)

2.3 머신 러닝을 위한 소프트웨어

이 책을 읽는 독자는 절차적 언어인 파이썬에 기초 실력을 갖추었다고 가정하겠습니다. 제가 소개하는 내용은 파이썬 중급 혹은 고급 수준에 해당합니다. 여러분이 아직 사용해 보지 않은 itertools, collections, functools 등 파이썬 표준 라이브러리도 사용할 것입니다.

그리고 numpy, pandas, matplotlib, seaborn 등 파이썬의 수치 계산 및 데이터 과학 스택도 사용할 것입니다. 이 도구들의 모든 세세한 사항을 다 소개하지는 못할 것 같습니다. 그래도 너무 심화된 기능은 사용하지 않을 예정이니 이해하기 버겁지는 않을 것입니다. 이외에도 그다지 잘 알려지지 않은 한두 가지 패키지를 더 사용합니다.

수치 계산 라이브러리들을 사용하는 이유는 이들이 scikit-learn과 궁합이 잘 맞기 때문입니다. sklearn은 머신 러닝 아이디어를 가지고 놀 수 있는 아주 훌륭한 환경입니다. 이 라이브러리에는 다양한 학습 알고리즘과 평가 전략이 구현되어 있으며, 이들을 실행할 수 있는 통일된 인터페이스도 있습니다. 서로 다른 커맨드라인 학습 프로그램을 통합해 본 적 있나요? sklearn에서는 그러한 고통을 겪지 않아도 됩니다. 아 참, scikit-learn은 프로젝트 이름입니다. sklearn은 그 프로젝트의 파이썬 패키지 이름이지요. 사람들은 이 둘을 섞어서 사용합니다. 저는 sklearn을 쓰겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.