더북(TheBook)

DeepSeek-R1

2025년 1월에 출시된 DeepSeek-R1은 DeepSeek-V3을 기반으로 개발되었으며, 고급 추론 작업에 집중하고 있습니다. OpenAI의 o1 모델과 직접 경쟁할 수 있는 성능을 가지면서도 훨씬 낮은 비용 구조를 유지합니다. DeepSeek-V3과 마찬가지로 6,710억 개의 파라미터와 128,000 토큰의 컨텍스트 길이를 갖추고 있습니다. 또한 이 모델은 오픈소스로 공개되어 개발자들이 자유롭게 수정하고 활용할 수 있습니다. 특히 DeepSeek-R1이 공개된 이후 NVIDIA 주가가 17% 급락하는 등 시장에 큰 영향을 미쳤습니다.

다음은 DeepSeek-R1에 대한 벤치마크 결과입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.