
▲ 그림 1-2 GPT-4o의 답변
이와 같은 문제를 해결하기 위해서는 모델 자체를 최신 데이터로 재학습시켜야 하지만, 쉬운 일이 아닙니다. 그래서 RAG를 사용하여 최신 문서나 데이터베이스에서 검색한 후 최신 정보가 포함된 상태로 답변을 생성해야 합니다.
➋ 데이터의 한계
LLM은 일반적인 지식에 대한 학습은 잘되어 있지만, 특정 도메인(예 의료, 법률, 기업 내부 문서, 과학 논문)과 같은 전문 지식을 학습하는 데는 한계가 있습니다. 이를 해결하기 위해서는 LLM이 모르는 특정 도메인의 데이터베이스(예 회사 내부 문서, 법률 데이터 등)에서 정보를 검색하도록 구성해야 합니다.