그리고 numpy에서 잠시 봤던 마스크 기능을 데이터 프레임에서도 사용할 수 있습니다. 마스크는 특정한 조건을 만족하는지에 따라 참(True)과 거짓(False)를 반환하여, 우리가 원하는 데이터를 골라내는 데 유용합니다. 예를 들어, B 열의 데이터가 0.4보다 큰 지 확인하는 조건을 두어 참과 거짓을 반환할 수 있습니다.
import pandas as pd import numpy as np index = pd.date_range('1/1/2000', periods=8) df = pd.DataFrame(np.random.rand(8,3), index=index, columns=list('ABC')) print(df['B'] > 0.4)
실행 결과
2000-01-01 True 2000-01-02 False 2000-01-03 True 2000-01-04 False 2000-01-05 False 2000-01-06 True 2000-01-07 True 2000-01-08 False Freq: D, Name: B, dtype: bool