더북(TheBook)

데이터 의존성

LLM은 특정 언어, 특정 분야(예: 문학)에 한정되어서 데이터를 학습하지 않습니다. 그렇기 때문에 지금과 같이 다양한 질문에도 답변할 수 있는 것이죠. 하지만 모델이 특정 국가의 소설로만 학습을 할 경우 다른 지역의 문화적 맥락을 반영한 텍스트를 생성하는 데 한계가 있을 수 있습니다.

예를 들어 모델이 오직 프랑스 소설로만 학습된 경우를 가정해봅시다. 이 모델은 프랑스 문학, 문화, 역사 및 사회적 맥락에 대해 매우 풍부한 지식을 갖고 있겠죠? 이제 모델에 한국의 문화적 배경을 가진 이야기를 생성하도록 요청했다면 어떤 상황이 발생할까요? 모델은 우리나라에 대한 충분한 지식이 없기 때문에 우리의 전통, 관습, 역사적 배경 등을 적절히 반영하지 못할 것입니다.

▲ 그림 2-14 프랑스 혁명을 학습한 LLM이 5·18 광주 민주화 운동 설명

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.