LLM-as-a-Judge

Суть

Использование более мощной модели (например, GPT-4o) для оценки качества работы менее мощной модели или проверки твоего собственного контента.


🏗 Схема работы

  1. Worker: Маленькая/быстрая модель генерирует ответ.
  2. Judge: Большая модель проверяет ответ по критериям (точность, стиль, отсутствие воды).
  3. Feedback: Если оценка низкая, Judge отправляет ответ на доработку Worker’у.

🛠 Применение на практике

Создай промпт-фильтр. Прежде чем сохранить сгенерированный конспект в базу, прогони его через «Судью» с инструкцией: “Проверь, соответствует ли этот текст принципу Atomic Notes. Если нет — перепиши”.


Связанные концепции