Быстрый старт

Модель ресурсов для учета и управления

Как управлять финансовыми и вычислительными ресурсами (governance) в Meridian. Бюджет, ограничители количества запросов и количества токенов.

Обзор

Meridian поддерживает трёхуровневую иерархию ресурсов. Каждый уровень отвечает за свой срез контроля бюджета и rate limit: организационный учёт расходов, командное распределение бюджета и техническая точка доступа.

Клиент (Customer) — организация / биллинг-сущность
    ↓ один-ко-многим
Команда (Team) — функциональная или продуктовая группа
    ↓ один-ко-многим
Виртуальный ключ (Virtual Key) — точка доступа приложения или пользователя
    ↓ один-ко-многим
Provider Config — настройки конкретного AI-провайдера внутри VK

Клиент (Customer) в терминологии Meridian — это верхнеуровневая организационная сущность (например, бизнес-юнит, филиал, внешний контрагент). На неё агрегируется учёт расходов всех подчинённых команд и виртуальных ключей.

Гибкость привязки

Иерархия не обязательна полностью. Виртуальный ключ может быть привязан одним из трёх способов — взаимоисключающе:

  • VK → Команда → Клиент — стандартный путь для корпоративных сценариев;
  • VK → Клиент — напрямую к организации, без промежуточной команды (например, индивидуальный контрагент);
  • Отдельный VK — без привязки, только собственные лимиты ключа.

Виртуальный ключ не может одновременно принадлежать и команде, и клиенту.

Если ключ (Virtual Key) не привязан к какому либо Customer явно, его значит его учет идет на comm01 - клиента по-умолчанию.


Уровни и средства управления

УровеньБюджетRate limitsНазначение
Клиент (Customer)Совокупный лимит расходов организации
Команда (Team)Распределение бюджета между подразделениями
Виртуальный ключ (VK)Точка доступа с собственными лимитами и фильтрацией провайдеров/моделей
Provider Config (внутри VK)Точечный контроль по каждому AI-провайдеру

Клиент (Customer)

Верхнеуровневая сущность, отражающая организационную принадлежность.

  • Бюджет — независимый лимит расходов, ограничивающий совокупные траты всех подчинённых команд и VK.
  • Rate limits — ограничения по запросам и токенам в фиксированном окне.
  • Сброс — поддерживает скользящие и calendar-aligned интервалы (1d, 1w, 1M, 1Y).
  • Назначение — финансовый governance уровня организации, отчётность по контрагенту или бизнес-юниту.

Команда (Team)

Промежуточный уровень для группировки виртуальных ключей в рамках клиента.

  • Бюджет — независимый лимит для команды, проверяется дополнительно к бюджету клиента.
  • Rate limits — ограничения по запросам и токенам в фиксированном окне.
  • Сброс — те же интервалы, что и у клиента.
  • Назначение — распределение бюджета внутри организации между продуктовыми или функциональными группами.

Виртуальный ключ (Virtual Key)

Основная техническая сущность governance — то, что приложение фактически передаёт в заголовке запроса.

  • Бюджет — собственный лимит расходов VK.
  • Rate limits — ограничения по запросам и токенам в фиксированном окне.
  • Фильтрация — список разрешённых провайдеров и моделей.
  • Provider Configs — индивидуальные бюджеты, rate limits и веса для каждого AI-провайдера внутри VK.

Подробнее — Виртуальные ключи и Бюджеты и лимиты.


Поток проверки при запросе

При получении запроса с виртуальным ключом Meridian независимо проверяет все применимые бюджеты и rate limits в иерархии. Запрос проходит, только если каждый из них в пределах лимита.

1. Rate limits Provider Config        → проверка частоты по провайдеру
2. Бюджет Provider Config             → проверка расхода по провайдеру
3. Rate limits VK                     → проверка частоты на уровне ключа
4. Бюджет VK                          → проверка расхода на уровне ключа
5. Бюджет Команды (если привязана)    → проверка расхода команды
6. Бюджет Клиента (если привязан)     → проверка расхода организации

При успешном выполнении стоимость запроса списывается со всех применимых бюджетов одновременно. Подробности механики — Бюджеты и лимиты → Поток проверки бюджета.


Что дальше

  • Виртуальные ключи — создание VK, привязка к командам и клиентам, настройка фильтров.
  • Бюджеты и лимиты — детальная механика бюджетов, rate limits и calendar-aligned сбросов.
  • Маршрутизация — поведение системы при превышении бюджета или rate limits отдельным провайдером.

Содержание