다음은 전체 데이터에 대해서 열 우선 계산을 하는 방법입니다.
아까는 1개의 열을 1개의 열로 나누는 계산이었기 때문에 산술 연산자를 사용할 수 있었지만 여러 개의 열에 대한 계산을 하려면 pandas 라이브러리를 사용해야 합니다.
예를 들어 전체 데이터를 A열의 값으로 뺄 때는 sub() 함수를 사용합니다.
import pandas as pd import numpy as np index = pd.date_range('1/1/2000', periods=8) df = pd.DataFrame(np.random.rand(8,3), index=index, columns=list('ABC')) df['D'] = df['A'] / df['B'] df['E'] = np.sum(df, axis=1) df = df.sub(df['A'], axis=0) # A열의 데이터를 기준으로 열 우선 계산 df.head()
그림 15-14 A 열을 기준으로 열 우선 계산(뺄셈)을 한 결과
A열 값을 기준으로 전체 데이터에 대한 뺄셈이 이루어졌기 때문에 A열 값은 모두 0이 되며, B열 값도 기존의 값에서 A열 값만큼 뺀 값이 저장된 것을 확인할 수 있습니다.