대회 우승자뿐만이 아닙니다. 캐글은 매년 전 세계 머신 러닝 전문가와 데이터 과학자를 대상으로 설문 조사를 합니다. 수만 명이 참여한 이 설문 조사는 업계 동향을 보여 주는 가장 믿을 수 있는 자료 중에 하나입니다. 그림 1-13은 다양한 머신 러닝 소프트웨어 프레임워크 사용 비율을 보여 줍니다.
▲ 그림 1-13 머신 러닝과 데이터 과학 분야의 사용 도구(출처: https://www.kaggle.com/kaggle-survey-2021)
2016년에서 2021년까지 머신 러닝과 데이터 과학 업계 전체는 딥러닝과 그레이디언트 부스티드 트리 두 가지 방법을 압도적으로 많이 사용했습니다. 구체적으로 그레이디언트 부스티드 트리는 구조적인 데이터를 가진 문제에서 사용되고, 딥러닝은 이미지 분류 같은 지각에 관련된 문제에 사용됩니다.