머신 러닝을 다루는 기술 with 파이썬, 사이킷런: 1.8 마무리

1.8 마무리

1.8.1 앞으로

이 장에서는 요약할 만한 내용이 많지 않군요. 그 대신 이 책에 담긴 네 개의 부에서 어떤 내용을 다룰지 간단히 이야기하겠습니다.

1부는 머신 러닝의 여러 가지 타입과 성능 평가의 기본적인 요소들을 소개합니다. 또 우리가 다룰 내용에 익숙해지는 데 필요한 몇 가지 수학 주제와 개념을 간단히 살펴볼 것입니다. 여러분에게 수학 내용이 친절하게 전달되면 좋겠습니다. 곧 보겠지만, 저는 조금 다른 방식으로 설명하려고 합니다.

2부에서는 학습 시스템 평가에 관한 세부 내용을 다룹니다. 학습 시스템을 개발하는 데 가장 큰 리스크는 학습이 잘되었다고 스스로에게 거짓말하는 것이라고 생각합니다. 그다음 큰 리스크는 시스템을 둘러싼 복잡한 환경이 변화했음에도 맹목적으로 그 시스템을 계속 사용하는 것입니다. 복잡한 사회-기술적 시스템의 컴포넌트는 자동차 부품처럼 갈아 끼울 수 없습니다. 그리고 다가올 미래가 과거와 같을 것이라는 가정은 매우 조심스럽게 해야 하지요. 첫 번째 사안에서는 몇 가지 실용적인 예시를 설명하고 평가에 관련된 이슈를 이어서 소개하겠습니다. 두 번째 문제에서는 행운을 빕니다. 그 문제는 이 책에서 다루는 내용을 벗어날 뿐만 아니라, 환경에 따라 다르게 동작하는 데이터를 처리하려면 아주 많은 경험과 지혜가 필요합니다.

3부에서는 학습 알고리즘을 몇 가지 더 소개하고 효율적으로 학습할 수 있도록 데이터를 조작하는 방식을 배울 것입니다. 그러고 나서 모델의 세부 사항을 조작함으로써 성능을 더 개선시킬 수 있는 방법을 살펴봅니다.

4부는 복잡도가 증가함에 따라 발생하는 여러 문제점을 다루는 방법을 소개합니다. 깔끔하게 정리된 테이블형 데이터가 아닌 이미지와 텍스트를 처리하고, 여러 하위 학습 모델로 구성된 학습 모델을 만들어 볼 것입니다. 그리고 마지막으로 지금까지 배운 여러 학습 시스템이 그보다 훨씬 복잡한 모델들과 어떻게 연결되는지 알아보면서 이 책을 마치겠습니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.