모두의 딥러닝 개정 3판: 3 판다스를 활용한 데이터 조사

다음과 같이 출력됩니다. 파이썬에서는 숫자를 0부터 세기 때문에 맨 첫 번째 행이 1이 아닌 0입니다.

이제 정상과 당뇨 환자가 각각 몇 명씩인지 조사해 봅시다. 불러온 데이터 프레임의 특정 칼럼을 불러오려면 df[“칼럼명”]이라고 입력하면 됩니다. value_counts() 함수를 이용하면 각 컬럼의 값이 몇 개씩 있는지 알려 줍니다.

df["diabetes"].value_counts()

그러면 다음과 같은 정보가 화면에 출력됩니다. 정상인 500명과 당뇨병 환자 268명을 포함, 총 768개의 샘플이 준비되어 있는 것을 알 수 있습니다.

실행 결과

0    500
1    268
Name: diabetes, dtype: int64

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.