더북(TheBook)

평가-최적화

평가-최적화(evaluator-optimizer)는 두 LLM이 상호작용하면서 응답의 품질을 높이는 방식입니다. 평가 에이전트가 응답에 대해 점수를 매기거나 피드백을 제공하고, 최적화 에이전트가 이를 반영해 다시 응답하며, 이러한 과정을 반복해 평가 기준을 충족하는 최종 응답을 도출합니다.

그림 1-6 평가-최적화

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.