더북(TheBook)

LLM의 성공은 많은 LLM의 기반이 되는 트랜스포머 구조와 방대한 훈련 데이터 덕분입니다. 이를 통해 수동으로 인코딩하기 어려운 다양한 언어적 뉘앙스, 문맥, 패턴을 감지할 수 있습니다.

트랜스포머 구조를 기반으로 모델을 구현하고 대규모 훈련 데이터셋으로 LLM을 훈련하는 방식은 NLP 분야를 근본적으로 변화시켰습니다. 사람의 언어를 이해하고 상호 작용하기 위해 필요한 유능한 도구를 제공했습니다.

이 책의 주요 목표는 ChatGPT 같은 트랜스포머 구조 기반의 LLM을 단계적으로 코드로 구현하면서 LLM을 이해하는 것입니다. 이어지는 절에서 이를 위해 필요한 기초적인 개념을 소개합니다.

 

 

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.