더북(TheBook)

2. 상관분석하기

# 양의 상관관계일 경우
>>> import numpy as np
>>> np.random.seed(1)
>>> x = np.random.randint(0, 50, 500)      # 0~50 사이의 난수 500개 생성
>>> y = x + np.random.normal(0, 10, 500)   # x와 양의 상관관계를 갖는 y를 생성(noise 포함)
>>> np.corrcoef(x, y)
array([[1.        , 0.81989877],
       [0.81989877, 1.        ]])

>>> import matplotlib.pyplot as plt
>>> plt.scatter(x, y)   # x와 y의 각 값에 해당되는 좌표에 점을 찍어 플롯 출력하기
>>> plt.show()

 

 

# 음의 상관관계일 경우
>>> x = np.random.randint(0, 50, 500)
>>> y = 100 - x + np.random.normal(0, 5, 500) # x와 음의 상관관계를 갖는 y를 생성(noise 포함)
>>> np.corrcoef(x, y)
array([[ 1.       ,  -0.94410499],
       [-0.94410499,  1.        ]])


신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.