SECTION 3.3 DeepSeek-R1의 원리
이번에 발표된 DeepSeek-R1 모델의 핵심 원리 몇 가지에 대해서 알아보겠습니다.
Chain-of-Thought
Chain-of-Thought(이하 CoT)는 거대 언어 모델이 복잡한 문제를 해결할 때, 논리적인 사고 과정을 단계별로 명시적으로 표현하는 기법입니다. 즉, 모델이 한 번에 정답을 출력하는 것이 아니라, 사람이 생각하는 방식처럼 단계별로 추론하며 답을 도출하는 방식입니다.
CoT를 더 잘 이해하기 위해 일반적인 답변 방식과 비교해보겠습니다. CoT가 적용되지 않는 일반적인 답변 방식은 다음과 같습니다.