더북(TheBook)

1.2.7 머신 러닝의 최근 동향

요즘 머신 러닝 알고리즘과 도구의 동향에 대한 정보를 얻는 좋은 방법은 캐글의 머신 러닝 경연을 살펴보는 것입니다. 매우 치열하게 경쟁하고(어떤 대회는 수천 명이 참여하고 상금이 높습니다) 다양한 종류의 머신 러닝 문제를 다루고 있기 때문에 캐글은 좋은 것과 나쁜 것을 평가할 수 있는 현실적인 잣대가 됩니다. “어떤 종류의 알고리즘이 경연 대회에서 우승하는 데 도움이 되나요? 상위에 랭크되어 있는 참가자들은 어떤 도구를 사용하나요?”

2019년 초 캐글은 2017년부터 모든 대회의 상위 5위 안에 드는 팀에 경연 대회에서 주로 어떤 소프트웨어 도구를 사용하는지 설문 조사를 진행했습니다(그림 1-12). 최상위 팀은 딥러닝 모델(대부분 케라스)과 그레이디언트 부스티드 트리(gradient boosted tree)(대부분 LightGBM이나 XGBoost 라이브러리)를 사용하는 것으로 나타났습니다.

▲ 그림 1-12 캐글 최상위 팀이 사용하는 머신 러닝 도구

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.