df = df.drop_duplicates(subset="a", keep='last') df
실행 결과
|
|
a |
b |
c |
n |
v |
|
|
|
d |
1 |
4.0 |
7.0 |
10.0 |
|
2 |
5.0 |
8.0 |
11.0 |
e |
3 |
6.0 |
9.0 |
NaN |
|
4 |
NaN |
9.0 |
12.0 |
TIP
매개 변수
사용할 수 있는 매개 변수 유형은 외우려 하지 말고 ‘df.drop_duplicates?’ 같은 방법으로 도움말 내용을 확인하고, 적당한 매개 변수를 찾아 적용하면 된다.
파이썬은 문서로 잘 정리되어 있다. 판다스 또한 잘 정리되어 있어서 판다스에서도 ‘help(), 메서드명?’로 도움말을 볼 수 있고, ‘메서드명??’로 소스 코드를 볼 수 있다. 예를 들어 ‘df.drop?’를 실행하면 drop에 대한 문서를 볼 수 있다.