모두의 인공지능 with 파이썬(개정 2판): 8.4 생성 신경망 살펴보기

■ 이미지 생성의 새로운 지평을 연 디퓨전 모델

디퓨전 모델은 GAN과는 전혀 다른 방식으로 이미지를 생성합니다. GAN이 2개의 인공지능이 서로 경쟁하면서 더 정교한 이미지를 만들어 내는 방식이라면, 디퓨전 모델은 처음부터 이미지를 흐릿하게 만들었다가 다시 원래의 형태로 복원하는 방식입니다.

비유를 통해 이 방식을 살펴보겠습니다. 유리잔에 잉크 한 방울을 떨어뜨리면 어떻게 될까요? 처음에는 잉크가 한곳에 모여 있어 색이 진하지만, 시간이 지나면서 점점 물에 퍼져 흐려집니다. 결국 잉크는 물 전체로 확산되어 어디가 원래 잉크였는지 구별할 수 없게 되죠.

디퓨전 모델도 이와 같은 방식으로 동작합니다. 처음에는 분명한 형태를 가진 이미지가 있습니다. 그런데 이 이미지에 점차 노이즈(잡음)를 추가하면서 데이터를 흐릿하게 만듭니다. 마지막에는 온통 랜덤한 잡음만 남게 되죠.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.