더북(TheBook)

트랜스포머의 등장과 이미지 기술의 변화

트랜스포머는 자연어 처리에서 혁신을 일으킨 기술이며, 이미지 인식 분야에도 큰 영향을 미쳤습니다. 특히 2020년 이후, 트랜스포머 기반의 새로운 접근 방식들이 기존 CNN을 뛰어넘는 성과를 보여주며 이미지 인식 기술의 패러다임을 변화시켰습니다.

2020년, 구글(Google)에서 비전 트랜스포머(ViT, Vision Transformer)를 발표하며 이미지 데이터를 트랜스포머로 처리할 수 있음을 입증했습니다. ViT는 이미지를 작은 패치로 나눈 후 트랜스포머의 셀프 어텐션(self-attention) 메커니즘10을 적용해 이미지를 분류하는 모델입니다.

▲ 그림 1-31 비전 트랜스포머(ViT)
출처: https://encord.com/blog/vision-transformers/

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.