더북(TheBook)

다음은 전체 데이터에 대해서 열 우선 계산을 하는 방법입니다.

아까는 1개의 열을 1개의 열로 나누는 계산이었기 때문에 산술 연산자를 사용할 수 있었지만 여러 개의 열에 대한 계산을 하려면 pandas 라이브러리를 사용해야 합니다.

예를 들어 전체 데이터를 A열의 값으로 뺄 때는 sub() 함수를 사용합니다.

import pandas as pd
import numpy as np
 
index = pd.date_range('1/1/2000', periods=8)
df = pd.DataFrame(np.random.rand(8,3), index=index, columns=list('ABC'))
df['D'] = df['A'] / df['B']
df['E'] = np.sum(df, axis=1)
df = df.sub(df['A'], axis=0)  # A열의 데이터를 기준으로 열 우선 계산
df.head()

그림 15-14 A 열을 기준으로 열 우선 계산(뺄셈)을 한 결과

 

A열 값을 기준으로 전체 데이터에 대한 뺄셈이 이루어졌기 때문에 A열 값은 모두 0이 되며, B열 값도 기존의 값에서 A열 값만큼 뺀 값이 저장된 것을 확인할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.