더북(TheBook)

DeepSeek-Math

2024년 4월에 발표된 이 모델은 수학적 추론에 특화되어 있으며, ‘Base’, ‘Instruct’, ‘RL’ 버전으로 제공됩니다. 특히 강화학습을 통해 수학 문제 해결 능력을 향상시켰습니다.

 

DeepSeek-V2 시리즈

2024년 5월에 출시된 DeepSeek-V2 시리즈는 DeepSeek의 두 번째 거대 언어 모델 버전으로, 강력한 성능과 낮은 훈련 비용에 중점을 두었습니다. 이 시리즈는 ‘DeepSeek-V2-Lite’, ‘DeepSeek-Coder-V2’, ‘DeepSeek-V2.5’와 같은 다양한 변형 모델을 포함하며, 특히 수학, 코딩, 자연어 이해 등 여러 분야에서 우수한 성능을 보였습니다. 또한 MoE 구조를 채택하여 효율적인 추론을 가능하게 했습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.