Золотой стандарт. Лучшая поддержка инструментов (Tools) и vision.
GPT-4o-mini
$0.15
$0.60
128K
Невероятно дешево для простых задач, классификации и ботов.
Claude 3.5 Sonnet
$3.00
$15.00
200K
Самый умный кодинг и следование сложным инструкциям.
Claude 3.5 Haiku
$0.25
$1.25
200K
Быстрый, как молния. Дешевле Sonnet в 12 раз.
Gemini 1.5 Pro
$1.25
$5.00
2M
Король контекста. Можно скормить целую библиотеку или часы видео.
Gemini 1.5 Flash
$0.075
$0.30
1M
Самый дешевый из “умных” API. Есть бесплатный ярус (Free Tier).
DeepSeek V3.2
$0.14
$0.28
128K
Демпинг из Китая. Почти уровень GPT-4o, но в десятки раз дешевле.
Llama 3.3 (70B)
~$0.60
~$0.60
128K
Через провайдеров (Groq, Together). Самая быстрая генерация.
💡 Полезные заметки для базы знаний:
Масштаб: 1M токенов ≈ 750 000 слов (или примерно 2 средних романа “Война и мир”).
Prompt Caching: Большинство провайдеров (Anthropic, DeepSeek, OpenAI) дают скидку до 90% на повторный ввод одного и того же длинного текста. Обязательно использовать для RAG.
Batch API: Если ответ нужен не мгновенно, а через 24 часа, OpenAI и Anthropic дают скидку 50%.
DeepSeek: В 2026 году это самый выгодный выбор для разработчиков в РФ (простая регистрация и оплата через крипту или посредников).