더북(TheBook)

1.1 LLM이란 무엇인가요?

1. LLM은 대용량 텍스트 데이터에서 훈련된 심층 신경망으로 사람의 텍스트를 이해하고, 생성하고, 응답할 수 있습니다. 입력의 다른 부분에 주의를 기울이기 위해 트랜스포머 구조를 사용하며 언어에 있는 뉘앙스를 처리하는 데 능숙합니다. LLM은 시퀀스에 있는 다음 단어를 예측하는 작업으로 훈련됩니다. 이를 통해 텍스트 안에 있는 문맥, 구조, 관계를 학습할 수 있습니다.

 

2. ‘대규모’는 파라미터(조정 가능한 가중치) 측면의 모델 크기와 훈련에 사용되는 방대한 데이터셋을 모두 의미합니다. LLM은 수백억 또는 수천억 개의 파라미터를 가진 경우가 많으며 시퀀스의 다음 단어를 예측하도록 훈련하면서 이런 파라미터를 최적화합니다.

 

3. LLM은 텍스트를 생성할 수 있기 때문에 종종 생성 AI의 한 유형으로 간주됩니다. 생성 AI는 텍스트, 이미지, 음악과 같은 새로운 콘텐츠를 생성하는 AI 시스템을 아우르는 포괄적인 용어입니다.

 

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.