더북(TheBook)

5.4.1 간단한 사기 분석 방법

간단한 사기 분석은 네트워크에 있는 사람의 행동은 그 사람과 연결되어 있는 사람들에 의해 영향을 받는다는 가정에 기반을 둡니다. 그래프에서 두 버텍스가 서로 연결되어 있으면 비슷한 행동을 할 가능성이 높다고 판단한 것입니다.

이를 바탕으로 어떤 버텍스 qF일 확률 P(F|q)는 다음과 같이 구할 수 있습니다.

Neighbourhoodn은 버텍스 n의 이웃을, w(n, nj)는 버텍스 nnj를 잇는 엣지의 가중치를 의미합니다. 이 사례에서는 범죄자와 연결된 엣지는 1을, 비범죄자와 연결된 엣지는 0을 부여합니다. 또 degreeq는 버텍스 q의 도수입니다. DOSnormalizedj는 잠시 후에 설명하겠습니다. 수식을 이용하면 확률을 다음과 같이 계산할 수 있습니다.

이 방법에 따르면 버텍스 q가 사기 범죄자일 확률은 67%입니다. 범죄자로 분류하기 위해서는 확률값에 대한 판단 기준이 필요합니다. 범죄자로 분류할 확률의 하한선이 30%라면 이 인물이 범죄자일 확률은 67%이므로, 우리는 이 사람을 범죄자(F)로 분류합니다.

그래프에 새로운 버텍스가 추가되면 수식에 필요한 버텍스의 도수와 엣지 정보가 바뀌기 때문에 다시 계산해야 합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.