7.2.1 대회 목적
현대에는 개개인이 사는 지역, 나라와 관계없이 온라인 커뮤니케이션을 통해 많은 정보를 접하고, 전달합니다. 정보 형태도 다양하지만 요즘은 특히 SNS와 커뮤니티의 발달로 이른바 ‘댓글’이라 부르는 비교적 짧은 글의 형태가 주류를 이루고 있습니다. 그런데 댓글 중에는 욕설, 음담패설, 협박 등 보는 사람이 불편하거나 혐오감을 가질 수 있는 것도 있습니다. 심지어 그 정도가 너무 심한 나머지 상대에게 심한 정신적 고통을 주는 경우도 허다합니다. 이런 글을 악성 댓글 또는 악플이라고 표현합니다.
머신러닝을 활용하여 주어진 글의 악성이 어느 정도인지 자동으로 파악하려는 연구와 노력이 많이 있었습니다. 이 과정에서 머신러닝이 가진 특성 때문에 정답이 의도하지 않은, 다른 답을 내는 경우가 있음을 발견했습니다. 예를 들어 gay라는 단어를 사용한 임의의 문장이 하나 있다고 생각해봅시다. 수많은 문장을 생각할 수 있지만 일반적으로 gay라는 단어가 들어간 문장은 좋은 문장이 아닐 것 같은 느낌이 듭니다. 데이터 또한 현실에서 일어날 수 있는 경우의 일부를 수집한 결과이기 때문에, 해당 단어를 포함한 문장은 악성일 확률이 그렇지 않은 경우보다 더 높을 것으로 예상됩니다. 그렇다면 관련 데이터를 잘 학습시켜서 문장이 얼마만큼 악성을 가졌는지 예측하는 머신러닝 모델을 만들고, 그 문장의 악성을 예측하면 대체로 어떤 답이 나오게 될까요?
Yesterday, I walked past the gay bar.