더북(TheBook)

2 소문자로 변환하기

 

파이썬은 같은 단어라도 대문자냐 소문자냐에 따라 다른 글자로 인식하므로 .lower() 기능을 사용해 모두 소문자로 변경한다.

df["text"] = df["text"].str.lower()

파이썬, python과 같이 의미는 같으나 표기가 다르게 되어 있는 단어도 하나로 통일한다. .replace()는 텍스트가 완전히 일치될 때만 사용할 수 있으므로, 만약 일부만 일치하는 것도 변경하고 싶다면 str.replace()를 사용해 원하는 텍스트로 변경한다.

df["text"] = df["text"].str.replace(
    "python", "파이썬").str.replace(
    "pandas", "판다스").str.replace(
    "javascript", "자바스크립트").str.replace(
    "java", "자바").str.replace(
    "react", "리액트")
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.