더북(TheBook)

4. 1번과 2번에서 일어나는 일은 다음과 같습니다.

 

번호

설명

1

입력 텍스트를 기반으로 다음 단어를 생성합니다.

2

이전 라운드의 출력이 다음 라운드의 입력이 됩니다.

5. GPT 같은 자기 회귀 모델은 이전 출력을 미래 예측을 위한 입력으로 사용합니다. 즉 GPT가 이전 시퀀스를 기반으로 새로운 단어를 생성한다는 의미입니다. 따라서 생성된 텍스트에 일관성과 유창성이 보장됩니다.

 

6. GPT 모델, 특히 GPT-3는 층 개수와 파라미터 개수 측면에서 원본 트랜스포머 모델보다 훨씬 큽니다. 늘어난 크기와 복잡성 덕분에 다양한 작업을 높은 정확도로 수행하는 능력을 가집니다.

 

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.