LLM-as-a-Judge
Суть
Использование более мощной модели (например, GPT-4o) для оценки качества работы менее мощной модели или проверки твоего собственного контента.
🏗 Схема работы
- Worker: Маленькая/быстрая модель генерирует ответ.
- Judge: Большая модель проверяет ответ по критериям (точность, стиль, отсутствие воды).
- Feedback: Если оценка низкая, Judge отправляет ответ на доработку Worker’у.
🛠 Применение на практике
Создай промпт-фильтр. Прежде чем сохранить сгенерированный конспект в базу, прогони его через «Судью» с инструкцией: “Проверь, соответствует ли этот текст принципу Atomic Notes. Если нет — перепиши”.