생성형 AI 완전 정복: 1.2.3 이미지 인식 기술의 발전 -11

그 이후 VGGNet, ResNet과 같은 더욱 깊고 효율적인 CNN 구조가 개발되면서 이미지 인식의 정확도와 확장성이 비약적으로 향상되었습니다.

VGGNet(Visual Geometry Group Network)은 3×3 크기의 작은 필터를 여러 층에 반복 사용해 깊은 네트워크 구조를 설계한 합성곱 신경망입니다. 이 모델은 11층에서 19층까지 다양한 버전으로 구성되었으며, 작은 필터를 쌓아 올리는 방식으로 계산 효율성을 유지하면서도 복잡한 패턴을 효과적으로 학습할 수 있습니다.

ResNet(Residual Network)은 잔차 학습과 스킵 연결을 도입해 심층 신경망에서 발생하는 기울기 소실 문제를 해결한 모델입니다. ResNet은 50, 101, 152층 모델로 잘 알려져 있을 만큼 깊은 네트워크에서도 효과적으로 학습할 수 있음을 증명했습니다.

• 잔차 학습(residual learning): 잔차 학습은 네트워크의 각 층이 입력의 잔여(residual) 정보를 학습하도록 설계된 방식입니다. 이 방식을 통해 네트워크가 학습해야 할 매핑을 줄여 학습을 용이하게 하고, 각 층 간 직접 연결이 가능해집니다.

• 스킵 연결(skip connection): 스킵 연결은 여러 층을 건너뛰어 이전 층의 출력을 후속 층에 직접 더하는 방식입니다. 이 방식은 네트워크가 더 깊어질수록 발생할 수 있는 기울기 소실 문제를 완화합니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.