Multi-tenant · Лимиты на тенанта · Рубли

AI API для
SaaS-продукта

Добавьте AI-фичи прямо в свой продукт — автокомплит, суммаризацию, встроенный чат и саппорт — через один OpenAI-совместимый API. Лимиты на тенанта, понятная себестоимость на пользователя, оплата в рублях и стабильный доступ из РФ без VPN.

Ключ на каждый проект Лимит на тенанта Закрывающие документы
GROWMI / SAAS-БИЛЛИНГ LIVE
Активных тенантов
1 240
Запросов сегодня
86 300
Расход на юзера
~7 ₽
Аптайм
99.9%
БИЛЛИНГ: ₽ / ТЕНАНТДОСТУП: БЕЗ VPN
Проблема и решение

Зарубежный API ломает фичу в проде

Встроить AI в SaaS на иностранных провайдерах из России — постоянная борьба с оплатой, доступом и бухгалтерией. GROWMI снимает все три блокера сразу.

Без GROWMI

  • Зарубежный API не оплатить из РФ — нужны иностранные карты и валютный счёт.
  • Нестабильный доступ через VPN/прокси ломает AI-фичу прямо в продакшене.
  • Валютные риски: курс прыгает, себестоимость на пользователя плавает.
  • Нет закрывающих документов — бухгалтерия не может провести расход.
  • Один общий ключ на всё: не видно, какой тенант сколько ест.

С GROWMI

  • Рублёвый баланс: карта РФ или счёт, никакой валюты и иностранных карт.
  • Российский эндпоинт api.growmi.ru — прямой доступ из вашей инфраструктуры без VPN.
  • Цена в рублях за 1K токенов фиксируется в кабинете — себестоимость предсказуема.
  • Счёт, акт и УПД для юрлица — расход проводится по бухгалтерии без вопросов.
  • Ключи на проект и лимиты на тенанта — расход изолирован и виден по каждому.
AI-фичи в продукте

Что встраивают в SaaS

UX

Автокомплит и подсказки

Умное автодополнение в редакторах, формах и поиске: продолжение текста, подсказки команд и сниппеты прямо в интерфейсе продукта.

Анализ

Суммаризация

Краткие выжимки звонков, тикетов, переписок и документов — резюме встречи или треда одним вызовом, без ручного разбора.

Чат

Встроенный AI-чат и саппорт

Ассистент внутри продукта и автоответы первой линии поддержки: отвечает по контексту аккаунта, передаёт сложное оператору.

Контент

Генерация и классификация

Генерация описаний, писем и постов, разметка заявок и тегирование, извлечение полей в JSON для дальнейшей обработки.

Server-side вызов

Ключ на тенанта и метка пользователя

Совместимо с OpenAI SDK. На бэкенде подставляйте ключ нужного продукта и помечайте запрос идентификатором тенанта через user — расход потом агрегируется по tenant_id.

from openai import OpenAI

# ключ берём по проекту/среде из вашего секрет-хранилища
client = OpenAI(
    base_url="https://api.growmi.ru/v1",
    api_key=tenant_project_key,
)

resp = client.chat.completions.create(
    model="gpt",
    # метим расход тенантом — потом агрегируем по нему
    user=f"tenant:{tenant_id}",
    messages=[{"role": "user", "content": prompt}],
)
print(resp.choices[0].message.content)
Как считать себестоимость на пользователя

От токенов до маржи в вашем тарифе

Расход в рублях известен по логам, поэтому экономику на пользователя вы считаете заранее и закладываете AI в свой прайс без сюрпризов.

01

Токены на действие

Замеряете вход и выход на одно AI-действие (например, суммаризация тикета) и переводите в рубли по цене за 1K токенов.

02

Действий на юзера

Берёте среднее число AI-действий, которое делает один активный пользователь за месяц по вашей аналитике.

03

Стоимость на юзера/мес

Умножаете стоимость действия на число действий — получаете AI-себестоимость одного пользователя в месяц.

04

Маржа в тариф

Закладываете эту себестоимость и нужную наценку в цену своего плана — фича остаётся прибыльной на любом масштабе.

# себестоимость AI на пользователя в месяц, ₽
cost_per_action = (in_tokens/1000)*price_in + (out_tokens/1000)*price_out
cost_per_user   = cost_per_action * actions_per_user

# пример: ~0.24 ₽ за действие × 25 действий/мес ≈ 6 ₽/юзер
# при тарифе 490 ₽/мес AI занимает ~1.2% — закладываем маржу
Ключи и лимиты

Изолируйте продукты, среды и тенантов

Ключ на продукт и среду

Отдельный API-ключ для каждого продукта и окружения — dev, staging, prod. Утёк один ключ — отзываете только его, остальное работает.

Месячный лимит на ключ

Потолок расхода в рублях на каждый ключ и пороги оповещений. При достижении лимита запросы по ключу отклоняются — бюджет под контролем.

Лимит на тенанта в backend

Квоты на тенанта и пользователя задаёте в своём backend по меткам расхода. Превысил план — гасите фичу или предлагаете апгрейд.

FAQ

Вопросы SaaS-команд

Можно ли биллить клиентов в рублях?+

Да. Баланс GROWMI пополняется в рублях с карты РФ или по счёту, а своих клиентов вы тарифицируете как угодно — внутри собственного биллинга. Себестоимость AI в рублях известна заранее по логам, поэтому маржу в тариф закладываете точно, без валютных пересчётов.

Как изолировать расход по тенантам?+

Выдавайте отдельный ключ на проект или среду и помечайте каждый запрос идентификатором тенанта через поле user. В логах кабинета расход виден по ключам, а сумму по конкретному tenant_id вы агрегируете на своей стороне для биллинга и отчётов.

Нужен ли VPN на нашем сервере?+

Нет. Эндпоинт https://api.growmi.ru/v1 доступен напрямую из российской инфраструктуры — серверов, контейнеров и CI. VPN и прокси не нужны, поэтому фича в проде не падает из-за блокировок и нестабильных туннелей.

Есть ли закрывающие документы для юрлица?+

Да. Для юрлиц выставляем счёт и предоставляем закрывающие документы — акт и УПД. Оплата по безналу в рублях, расход по проектам выгружается для бухгалтерии и сверки.

Что будет при достижении лимита?+

На каждый ключ задаётся месячный лимит расхода и пороги оповещений. При достижении потолка запросы по ключу отклоняются стандартным кодом ошибки — фича изолирована, остальные продукты и среды продолжают работать. Лимит на конкретного тенанта вы дополнительно контролируете в своём backend.

Ранний доступ

Получите API-ключ первыми

Оставьте email — пришлём ключ, тестовый баланс и ссылку на документацию.

Без спама — только запуск.
Читать дальше

Смежные страницы