더북(TheBook)

참고

트랜스포머 vs. LLM

오늘날 LLM은 트랜스포머 구조를 기반으로 합니다. 따라서 트랜스포머와 LLM은 동의어로 사용되는 경우가 많습니다. 하지만 모든 트랜스포머 모델이 LLM은 아니며 컴퓨터 비전(computer vision)에 사용되기도 합니다. 또한 순환 신경망이나 합성곱 신경망 기반의 LLM도 있기 때문에 모든 LLM이 트랜스포머인 것도 아닙니다. 이런 다른 접근 방법의 이면에 있는 주요 동기는 LLM의 계산 효율성을 높이는 것입니다. 다른 구조의 LLM이 트랜스포머 기반 LLM의 능력과 경쟁할 수 있는지, 실전에 채택되는지는 두고 봐야 합니다. 편의상 이 책에서 사용하는 ‘LLM’이란 용어는 GPT와 같은 트랜스포머 기반의 LLM을 뜻합니다(관심 있는 독자는 부록 B에서 다양한 구조를 제안하는 논문을 참고하세요) .

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.