더북(TheBook)

◼︎ 54. 숫자형 데이터를 구간으로 나누기

# a열을 두 개로 나누어 각각 새롭게 레이블을 만들라는 의미입니다.
df['qcut'] = pd.qcut(df['a'], 2, labels=["600이하","600이상"])

실행 결과

 

 

a

b

c

sum

multiply

qcut

n

v

d

1

4

8

12

24

384

600이하

2

5

9

13

27

585

600이하

e

1

6

10

14

30

840

600이상

2

7

11

15

33

1155

600이상

◼︎ 55. 기준 값 이하와 이상을 모두 통일시키기

# a열에서 5 이하는 모두 5로, 6 이상은 모두 6으로 변환합니다.
df['clip'] = df['a'].clip(lower=5, upper=6)

실행 결과

 

 

a

b

c

sum

multiply

qcut

clip

n

v

 

 

 

 

 

 

 

d

1

4

8

12

24

384

600이하

5

2

5

9

13

27

585

600이하

5

e

1

6

10

14

30

840

600이상

6

2

7

11

15

33

1155

600이상

6

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.