랭체인으로 RAG 개발하기: 3.2 DeepSeek가 부각된 배경 -6

역시 출력 토큰만 비교했을 때, DeepSeek-Reasoner는 1M당 $2.19인 반면에 o3-mini는 $4.40입니다. 역시 1/2 수준의 가격으로 제공하고 있습니다.

이제 궁금한 점은 DeepSeek-V3의 성능이 OpenAI의 GPT-4o-mini와 유사한지, 그리고 DeepSeek-R1이 o3-mini와 비슷한지 여부겠죠? 이는 실습을 통해서 직접 비교하고 정확히 확인해보겠습니다.

어떻게 저렴한 가격이 가능한가?

그럼 DeepSeek는 어떻게 OpenAI보다 저렴한 가격에 서비스할 수 있는 걸까요? 그 이유에 대해 알아보겠습니다.

적은 GPU 연산량

DeepSeek는 Mixture of Experts(이하 MoE) 아키텍처 기술을 사용하여 GPU 사용량을 줄였습니다. 기존 트랜스포머 모델(예 GPT 계열)은 모델의 모든 파라미터를 항상 사용해 학습하고 추론을 수행하는 반면에 MoE 모델은 전문가(Expert) 네트워크 여러 개를 두고, 매번 일부 전문가만 활성화하여 추론을 수행하기 때문에 GPU 사용량이 적습니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.