더북(TheBook)

6.3 상관분석의 활용

지금까지 상관분석과 분산분석에 대한 내용을 살펴보았다. 최근 딥러닝이 많이 유행하는데, 굳이 상관분석과 분산분석을 이용해야 하는지 의문스러울 수 있다. 하지만 딥러닝이 되었건 혹은 다른 새로운 기법이 되었건, 두 분석은 데이터 분석의 기본이며 여전히 중요하다. 이 두 분석만으로도 많은 인사이트를 얻을 수 있다. 이제 이 두 분석 중에서도 상관분석을 활용한 사례를 다뤄보겠다.

먼저 주식 시장을 분석한 사례를 살펴보겠다. 미국 증시에서 주요 기업 500개의 주가로 만들어진 S&P 500이 있다. S&P 500은 중요한 투자지표로 다방면에서 활용되고 있어서 S&P 500의 움직임을 이해하는 것이 중요하다. 여러 요인이 S&P 500에 영향을 주겠지만, 그중에서도 주요 경제 뉴스와 S&P 500의 관계를 살펴보았다. 경제 뉴스는 경제 분야에 전문성을 가진 기자가 작성하는데, 어떻게 보면 그의 생각과 판단이 주식 시장의 등락을 이해하는 데 중요한 인사이트를 제공하는 것일 수도 있다. 그가 작성한 경제 뉴스에서 그의 생각이 묻어나오는 단어들, 예를 들어 긍정과 부정의 단어들을 잘 분석한다면 매일 쏟아져 나오는 수십, 수백 개의 경제 뉴스를 하나씩 정독하지 않더라도 주가의 움직임을 이해할 수 있지 않을까. 경제 뉴스 기자들의 일종의 집단 지성을 활용하는 차원에서, 그들의 글에서 긍정적인 단어가 많이 사용된다면 이는 주식 시장에 대한 긍정적인 시그널로 활용할 수 있을 것이다.

실제로 많은 금융 기관에서 AI, 자연어 처리, 머신 러닝 등을 업무에 활용하고 있다. AI를 증권사 애널리스트 보고서나, 지금 다루는 사례처럼 보고서나 뉴스의 감성을 측정해서 수익률과의 관계를 분석할 때 활용한다.

대표적인 경제 신문인 다우존스와 월스트리트 저널을 대상으로 24,006건의 기사를 분석하였다. 기간은 2014년 8월~2015년 7월까지 총 1년이다. 물론 좀 더 정확하게 분석하기 위해서 다른 신문도 대상으로 하는 것이 좋겠지만, 이 절에서는 뉴스와 주가의 상관분석을 간단하게 살펴보는 것이 목적이니 이대로 진행하였다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.