더북(TheBook)

1.1.4 생태계로서 R

R은 하나의 생태계로서 IT 산업을 넘어 모든 데이터 관련 분야에서 급속하게 성장하여 자신만의 영역을 확장하고 있다. 사용자 대다수는 전문 개발자가 아니라 오히려 데이터 분석가 혹은 통계학자다. 이들이 최상위 레벨의 코드를 작성하는 것은 아니지만, R 언어라는 생태계에 최첨단 도구들을 공급하는 것은 틀림없다. 또 똑같은 도구를 다시 개발할 필요 없이 이미 있는 도구를 자유롭게 내려받아 사용할 수 있다.

예를 들어 어떤 계량경제학자가 시계열 데이터 패턴을 검출하는 새로운 방법을 소개하는 확장 패키지를 만든다고 하자. 여러 사람이 여기에 관심을 갖고 이것의 유용함을 공감할 수 있다. 일부 사용자는 자신의 전문 지식을 활용하여 원본 코드를 좀 더 빠르고 범용적으로 개선할 수 있을 것이다. 얼마 후, 한 퀀트 투자자는 평소 자신의 포트폴리오에서 위험을 초래하는 패턴을 검출하게 되고 이 방법을 거래 전략에 활용하여 도움을 얻을 수 있을 것이다. 결국 언젠가는 한 계량경제학자의 도구를 실제 산업에 적용하여 투자자가 위험도 낮은 포트폴리오를 찾는 날이 올 수도 있을 것이다.

바로 이러한 방식으로 생태계가 돌아간다. 그리고 이것이야말로 R이 이 분야에서 떠오르는 이유 중 하나다. IT 산업(일반적으로 데이터 과학 관련 학계와 산업계) 외부의 최첨단 기술을 이러한 생태계에서 보편적으로 사용 가능한 도구들에 바로 적용할 수 있다는 강점이 여기에 있다. 즉, 이는 현장 지식과 데이터 과학에서 생산성을 향상시켜 실제 가치로 전환하는 것을 좀 더 원활하게 한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.