А есть ли бесплатные API нейросетей?

от автора

Третьего дня я решил сделать лид-магнит для своего Telegram-канала. Схема такая — бот собирает у пользователя текст, обрабатывает его нейросетью, выдает что-то полезное, и в конце просит подписаться на канал в обмен на результат. Aiogram 3, Python, VPS за 150 рублей — ничего необычного.

Встал первый вопрос — за что платить? Бот прототипный, аудитория на входе пока еще, собственно, не особо и понятно сколько человек. Платить $20 в месяц ради теста гипотезы — нет. Мы не ищем легких путей. Пошел разбираться, что вообще бесплатного есть.

Groq

console.groq.com

Groq работает на собственных чипах LPU, инференс — Llama 3.1 8B выдает около 2 000 токенов в секунду. API OpenAI-совместимый.

Есть вполне реальные лимиты бесплатного плана:

Chat / LLM:

Модель

Запросов/мин

Запросов/день

Токенов/мин

Токенов/день

llama-3.1-8b-instant

30

14 400

6 000

500 000

llama-3.3-70b-versatile

30

1 000

12 000

100 000

openai/gpt-oss-120b

30

1 000

8 000

200 000

openai/gpt-oss-20b

30

1 000

8 000

200 000

qwen/qwen3-32b

60

1 000

6 000

500 000

llama-4-scout-17b

30

1 000

30 000

500 000

groq/compound

30

250

70 000

без лимита

groq/compound-mini

30

250

70 000

без лимита

14 400 запросов в день от Llama 3.1 8B — это 10 запросов в минуту на протяжении 24 часов. Для прототипного бота с сотнями пользователей — более чем хватит.

Speech-to-Text (если бот принимает голосовые):

Модель

Запросов/мин

Запросов/день

Секунд аудио/день

whisper-large-v3

20

2 000

28 800

whisper-large-v3-turbo

20

2 000

28 800

Очень даже неплохо.

Text-to-Speech (если нужны голосовые ответы):

Модель

Запросов/мин

Запросов/день

orpheus-v1-english

10

100

orpheus-arabic-saudi

10

100

100 запросов в день по TTS — немного. Для статусных сообщений или приветствий хватит, для основного контента — нет.

OpenRouter — агрегатор с бесплатными моделями

openrouter.ai — регистрация, ключ, и сразу доступ к моделям.

Лимиты для бесплатных моделей:

  • 20 запросов в минуту

  • 50 запросов в день — без пополнения счета

  • 1 000 запросов в день — после пополнения от $10 (деньги не тратятся на :free модели)

Актуальные бесплатные модели на май 2026, все по $0/1M токенов:

Модель

Контекст

qwen3-coder-480b-a35b

1 050K

kimi-k2.6

262K

gemma-4-26b-a4b

262K

llama-3.3-70b-instruct

131K

minimax-m2.5

205K

hermes-3-405b-instruct

131K

qwen3-next-80b-a3b-instruct

262K

lfm2.5-1.2b-thinking

33K

Есть еща такая штука openrouter/free. Он сам выбирает из доступных бесплатных ту, что поддерживает параметры запроса.

Google Gemini API — есть бесплатный тир, но с оговоркой

aistudio.google.com/apikey

Актуальные модели на май 2026 с бесплатным доступом:

  • gemini-2.5-flash

  • gemini-2.5-flash-lite

  • gemini-2.5-pro

  • gemini-3.1-flash-lite

  • gemini-3.5-flash

Важный момент: на бесплатном тире промпты и ответы используются для обучения Google. Если бот обрабатывает данные, которые пользователь не собирался никуда передавать — это нужно учитывать. На платном тире обучение отключается.

Cloudflare Workers AI — 10 000 Neurons в день

developers.cloudflare.com/workers-ai

Бесплатно: 10 000 Neurons в день (сбрасывается в 00:00 UTC).
Выше квоты: $0.011 за 1 000 Neurons — нужен Workers Paid план ($5/мес).

100+ моделей: Llama, Mistral, Qwen, Phi, Stable Diffusion и другие.

ElevenLabs — если нужен TTS

elevenlabs.io

Plan

Credits/мес

~Минут TTS

Free

10 000

~10 мин

Starter

30 000

~30 мин

10 000 кредитов в месяц — это примерно 10 минут синтезированной речи. Для приветствий или разовых сообщений в боте — хватит. Важно: Free план не дает коммерческой лицензии, только личное использование.

DeepL — если нужен перевод

deepl.com/en/checkout?is_api=true — ключ после регистрации.

Параметр

Значение

Символов/месяц

500 000

Изображения (beta)

Не тарифицируются

Word/Excel/PDF/PPT

до 10 MB и 500K символов

500K символов в месяц — это примерно 350 страниц A4. 

OCR.space — если нужно распознавание текста с картинок

ocr.space/ocrapi/freekey

Параметр

Значение

Запросов/день

500 (по IP)

Engine 1/2 в месяц

25 000 конвертаций

Engine 3 в месяц

2 500 конвертаций

Engine 3 — рукописный текст, таблицы в Markdown, 200+ языков.


По итогу, основная модель у меня — llama-3.3-70b-versatile. 1 000 запросов в день для теста гипотезы очень даже хватает — пока при моем мелком потоке пользователей до потолка еще не добрался. 

Если лимиты начнут упираться (очень на это надеюсь) — буду переходить на что-то уже более масштабируемое.

Надеюсь, Вам было полезно. Здоровья и хорошего настроения, дорогие читатели.

ссылка на оригинал статьи https://habr.com/ru/articles/1041398/