더북(TheBook)

트랜스포머의 등장과 멀티모달 생성

2017년 트랜스포머가 등장하며 LLM인 GPT나 BERT와 같은 모델에 큰 영향을 미쳤으며, 이후 멀티모달 모델에서도 그 가능성을 확장했습니다.

달리는 오픈AI(OpenAI)에서 2020년에 발표한 멀티모달 모델로, 텍스트를 입력받아 이미지를 만들어 내는 생성 모델입니다. 트랜스포머를 활용해, 텍스트와 이미지 간 관계를 학습하는 방식으로 동작합니다. 이 모델은 이미지 생성을 위한 혁신적인 접근 방식으로, 언어와 시각적 개념을 결합할 수 있는 능력을 갖추고 있습니다.

▲ 그림 1-38 달리로 생성한 그림 예시
출처: https://openai.com/ko-KR/index/dall-e/

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.