더북(TheBook)

Note 컨트리 음악 진단하기

솔직히 나는 컨트리 음악을 매우 좋아한다. 글쎄, 컨트리 음악이 특정한 유형의 음악이기는 하다. 이상하게 보지는 마라. 컨트리 음악을 이용하여 베이즈 이론을 설명하고 핵심을 전달할 생각이다.

어떤 사람이 컨트리 음악을 좋아하는지 혹은 좋아하지 않는지 알기 위해 낸시 그리피스, 메리 채핀 카펜터, 가스 브룩스, 라일 로벳의 음악을 섞어 들려주면서 테스트를 진행한다. 두뇌의 다양한 반응을 통해 부정적인 또는 긍정적인 반응을 유추할 수 있다.

우리는 긍정 테스트(컨트리 음악을 좋아하고 테스트의 결과 역시 선호하는 것으로 나오는)가 95% 정확하다는 것을 알고 있다. 청취자는 컨트리 음악을 좋아한다. 테스트는 컨트리 음악을 좋아하지 않는 사람을 가려내는 데 99% 정확하다. 전문가들은 이를 95%의 민감도(sensitivity)와 99%의 특이도(specificity)라고 부른다. 테스트를 T, 컨트리 음악을 좋아하는 사람을 C라고 하자. 다음과 같은 확률을 얻을 수 있다.

C는 컨트리 음악을 좋아한다.

~C는 컨트리 음악을 좋아하지 않는다.

T는 컨트리 음악 선호 검정의 결과가 긍정을 나타낸다.

~T는 컨트리 음악 선호 검정의 결과가 부정을 나타낸다.

민감도 확률은 다음과 같다.

p(T|C) = 0.95

특이도는 다음과 같다.

p(~T|~C) = 0.99

마지막으로, 인구의 2%가 컨트리 음악을 좋아할 것이라고 가정한다.

p(C) = 0.02

이런 실험이 제대로 진행되어도 거짓 긍정 반응이 들어갈 수 있다는 것을 알고 있다. 어떤 사람은 실제로 좋아하지 않는데 컨트리 음악을 좋아한다는 긍정 반응을 낼 수도 있다. 물론 거짓 부정 반응도 고려해야 한다. 어떤 사람은 컨트리 음악을 좋아하지만, 테스트에는 부정 반응을 낸다.

베이즈 이론을 사용하면 이러한 정보를 통해 확률을 계산할 수 있다. 무시무시한 수학책에서는 다음과 같이 나타낸다.

 

복잡해 보이는가? 수식의 값을 알고 나면 쉬워진다.

 

테스트가 거짓 긍정 반응을 돌려줄 확률은 아직도 51%다. 51%면 사람들이 진짜 그만큼 좋아하는 건 아니기 때문에 이번 실험에서는 훌륭한 음악들이 제대로 평가받지 못할 것 같다.

가능한 가장 간단한 방법으로 세 가지 이론, 즉 그래프 이론, 확률, 베이즈 이론을 설명했다. 이제 베이지안 네트워크로 돌아가 실제 베이지안 네트워크에서 이 세 가지가 어떻게 합쳐지는지 살펴보자.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.