AI Knowledge Base

alignment

с этим тегом 2 элемента

  • 16 апр. 2026 г.

    Direct Preference Optimization (DPO)

    • architecture
    • alignment
    • fine-tuning
    • dpo
  • 16 апр. 2026 г.

    Reinforcement Learning from Human Feedback (RLHF)

    • architecture
    • rlhf
    • alignment
    • machine_learning

Создано с помощью Quartz v5.0.0 © 2026

  • GitHub