더북(TheBook)

LLM은 이와 같이 사전 학습을 통해 방대한 양의 문장을 분석하고 복잡한 신경망 두뇌에 패턴을 저장하여 단어와 개념 간의 연결 고리를 형성합니다. ‘개’와 ‘강아지’가 서로 연관된 의미와 문맥을 가지고 있기 때문에 비슷한 벡터 표현을 가지고 있다고 저장하는 것이죠.

그러나 ‘개’와 ‘자전거’는 의미가 다르기 때문에 멀리 떨어져 있습니다. 벡터 공간은 단어의 유사점과 차이점을 기준으로 단어를 구성합니다.

 

미세 조정

사전 학습이 끝나면 LLM은 미세 조정 단계로 넘어갑니다. 이 단계에서는 구체적인 특정 작업과 관련된 더 작은 규모의 데이터 집합에 대해 추가로 학습합니다.

이는 교양 수업을 이수하고 나서 전공 수업에 집중하는 것과 같습니다. 예를 들어 과학의 기초를 학습한 후, 고급 생물학 수업을 듣는 것과 같은 느낌입니다.

LLM은 미세 조정에서 표식이 붙은 예제 데이터를 기반으로 특정 작업에 대한 결과를 생성하는 연습을 합니다. 표식이 붙은 데이터는 내용을 분류하거나 설명하는 표식으로 주석을 단 데이터를 의미합니다. 표식은 예상 결과의 방향을 제시하는 예제를 제공함으로써 모델을 학습시키는 데 도움이 됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.