◼︎ 54. 숫자형 데이터를 구간으로 나누기
# a열을 두 개로 나누어 각각 새롭게 레이블을 만들라는 의미입니다. df['qcut'] = pd.qcut(df['a'], 2, =["600이하","600이상"])
실행 결과
|
|
|
a |
b |
c |
sum |
multiply |
qcut |
|
n |
v |
||||||
|
d |
1 |
4 |
8 |
12 |
24 |
384 |
600이하 |
|
2 |
5 |
9 |
13 |
27 |
585 |
600이하 |
|
|
e |
1 |
6 |
10 |
14 |
30 |
840 |
600이상 |
|
2 |
7 |
11 |
15 |
33 |
1155 |
600이상 |
◼︎ 55. 기준 값 이하와 이상을 모두 통일시키기
# a열에서 5 이하는 모두 5로, 6 이상은 모두 6으로 변환합니다. df['clip'] = df['a'].clip(=5, =6)
실행 결과
|
|
|
a |
b |
c |
sum |
multiply |
qcut |
clip |
|
n |
v |
|
|
|
|
|
|
|
|
d |
1 |
4 |
8 |
12 |
24 |
384 |
600이하 |
5 |
|
2 |
5 |
9 |
13 |
27 |
585 |
600이하 |
5 |
|
|
e |
1 |
6 |
10 |
14 |
30 |
840 |
600이상 |
6 |
|
2 |
7 |
11 |
15 |
33 |
1155 |
600이상 |
6 |