더북(TheBook)

1.1.5 생성형 AI로의 발전

2010년대부터 딥러닝은 AI 기술의 본격적인 혁신을 이끌었습니다. 데이터 분석과 예측에 그치지 않고 텍스트, 이미지, 오디오 같은 창의적인 결과물을 만들어내는 생성형 AI 분야로 빠르게 진출하기 시작했습니다.

2015년, 이미지 분류・탐지・인식 성능을 겨루는 대회인 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 레스넷(ResNet)이라는 모델은 사람보다 더 높은 이미지 분류 정확도를 기록했습니다. 2016년에는 구글이 개발한 AI인 알파고(AlphaGo)가 이세돌 9단과의 바둑 대결에서 승리를 거두며 사람들에게 큰 충격을 안겨줬습니다. 또한 구글 연구 팀이 2017년에 발표한 트랜스포머(Transformer, 문장의 의미와 순서를 동시에 파악해 말하는 구조)는 기존 AI의 자연어 처리 성능을 획기적으로 개선한 모델로, 인간이 언어를 이해하는 방식을 모사했습니다.

2020년에는 이미지 분야에서 확산 모델(diffusion model, 이미지를 흐리게 만들었다가 거꾸로 선명하게 복원하면서 새 이미지를 생성하는 구조)이라는 새로운 딥러닝 모델이 등장했습니다. 자연스러운 이미지를 생성하는 확산 모델은 이미지 생성형 AI의 대표 기술로 자리 잡았습니다.

새로운 용어들이 계속 튀어나오니 어렵게 느껴지나요? 구체적인 원리는 뒤에서 살펴볼 테니 지금은 다양한 딥러닝 모델이 도입돼 텍스트, 이미지, 오디오 등의 창의적인 결과물을 만들어내는 생성형 AI 기술로 발전하고 있다는 사실만 알아두세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.