Модель ресурсов для учета и управления
Как управлять финансовыми и вычислительными ресурсами (governance) в Meridian. Бюджет, ограничители количества запросов и количества токенов.
Обзор
Meridian поддерживает трёхуровневую иерархию ресурсов. Каждый уровень отвечает за свой срез контроля бюджета и rate limit: организационный учёт расходов, командное распределение бюджета и техническая точка доступа.
Клиент (Customer) — организация / биллинг-сущность
↓ один-ко-многим
Команда (Team) — функциональная или продуктовая группа
↓ один-ко-многим
Виртуальный ключ (Virtual Key) — точка доступа приложения или пользователя
↓ один-ко-многим
Provider Config — настройки конкретного AI-провайдера внутри VKКлиент (Customer) в терминологии Meridian — это верхнеуровневая организационная сущность (например, бизнес-юнит, филиал, внешний контрагент). На неё агрегируется учёт расходов всех подчинённых команд и виртуальных ключей.
Гибкость привязки
Иерархия не обязательна полностью. Виртуальный ключ может быть привязан одним из трёх способов — взаимоисключающе:
- VK → Команда → Клиент — стандартный путь для корпоративных сценариев;
- VK → Клиент — напрямую к организации, без промежуточной команды (например, индивидуальный контрагент);
- Отдельный VK — без привязки, только собственные лимиты ключа.
Виртуальный ключ не может одновременно принадлежать и команде, и клиенту.
Если ключ (Virtual Key) не привязан к какому либо Customer явно, его значит его учет идет на comm01 - клиента по-умолчанию.
Уровни и средства управления
| Уровень | Бюджет | Rate limits | Назначение |
|---|---|---|---|
| Клиент (Customer) | ✓ | — | Совокупный лимит расходов организации |
| Команда (Team) | ✓ | — | Распределение бюджета между подразделениями |
| Виртуальный ключ (VK) | ✓ | ✓ | Точка доступа с собственными лимитами и фильтрацией провайдеров/моделей |
| Provider Config (внутри VK) | ✓ | ✓ | Точечный контроль по каждому AI-провайдеру |
Клиент (Customer)
Верхнеуровневая сущность, отражающая организационную принадлежность.
- Бюджет — независимый лимит расходов, ограничивающий совокупные траты всех подчинённых команд и VK.
- Rate limits — ограничения по запросам и токенам в фиксированном окне.
- Сброс — поддерживает скользящие и calendar-aligned интервалы (
1d,1w,1M,1Y). - Назначение — финансовый governance уровня организации, отчётность по контрагенту или бизнес-юниту.
Команда (Team)
Промежуточный уровень для группировки виртуальных ключей в рамках клиента.
- Бюджет — независимый лимит для команды, проверяется дополнительно к бюджету клиента.
- Rate limits — ограничения по запросам и токенам в фиксированном окне.
- Сброс — те же интервалы, что и у клиента.
- Назначение — распределение бюджета внутри организации между продуктовыми или функциональными группами.
Виртуальный ключ (Virtual Key)
Основная техническая сущность governance — то, что приложение фактически передаёт в заголовке запроса.
- Бюджет — собственный лимит расходов VK.
- Rate limits — ограничения по запросам и токенам в фиксированном окне.
- Фильтрация — список разрешённых провайдеров и моделей.
- Provider Configs — индивидуальные бюджеты, rate limits и веса для каждого AI-провайдера внутри VK.
Подробнее — Виртуальные ключи и Бюджеты и лимиты.
Поток проверки при запросе
При получении запроса с виртуальным ключом Meridian независимо проверяет все применимые бюджеты и rate limits в иерархии. Запрос проходит, только если каждый из них в пределах лимита.
1. Rate limits Provider Config → проверка частоты по провайдеру
2. Бюджет Provider Config → проверка расхода по провайдеру
3. Rate limits VK → проверка частоты на уровне ключа
4. Бюджет VK → проверка расхода на уровне ключа
5. Бюджет Команды (если привязана) → проверка расхода команды
6. Бюджет Клиента (если привязан) → проверка расхода организацииПри успешном выполнении стоимость запроса списывается со всех применимых бюджетов одновременно. Подробности механики — Бюджеты и лимиты → Поток проверки бюджета.
Что дальше
- Виртуальные ключи — создание VK, привязка к командам и клиентам, настройка фильтров.
- Бюджеты и лимиты — детальная механика бюджетов, rate limits и calendar-aligned сбросов.
- Маршрутизация — поведение системы при превышении бюджета или rate limits отдельным провайдером.