Поддерживаемые провайдеры

Cerebras

Конвертация Cerebras API в Meridian — полная OpenAI-совместимость, streaming, tool calling и обработка параметров.

Обзор

Cerebras — полностью OpenAI-совместимый провайдер, использующий весь набор фич OpenAI API. Meridian делегирует функциональность реализации OpenAI-провайдера со стандартной фильтрацией параметров. Ключевые характеристики:

  • Полная OpenAI-совместимость — поддержаны все chat, text и streaming фичи.
  • Полное tool calling — определения функций и параллельное исполнение инструментов.
  • Поддержка streaming — Server-Sent Events с трекингом использования токенов.
  • Сохранение параметров — пробрасываются все стандартные OpenAI-параметры.
  • Responses API — полная поддержка с конвертацией формата.

Поддерживаемые операции

ОперацияБез стримингаСтримингЭндпоинт
Chat Completions/v1/chat/completions
Responses API/v1/chat/completions
Text Completions/v1/completions
List Models/v1/models
Embeddings
Image Generation
Speech (TTS)
Transcriptions (STT)
Files
Batch

Неподдерживаемые операции (❌): Embeddings, Image Generation, Speech, Transcriptions, Files и Batch не поддерживаются upstream-API Cerebras. Запросы к ним возвращают UnsupportedOperationError.


1. Chat Completions

Параметры запроса

Cerebras поддерживает все стандартные параметры OpenAI chat completions. Полный справочник параметров и поведение — на странице OpenAI Chat Completions.

Фильтруемые параметры

Удаляются для совместимости с Cerebras:

  • prompt_cache_key — не поддерживается;
  • verbosity — специфично для Anthropic;
  • store — не поддерживается;
  • service_tier — специфично для OpenAI.

Reasoning-параметр

Cerebras делегирует в OpenAI через ToOpenAIChatRequest, поэтому reasoning-параметры преобразуются: значения reasoning.effort (например, minimallow) маппятся по конвенции OpenAI-совместимых провайдеров, а reasoning.max_tokens очищается/опускается (удаляется при конвертации).

Cerebras поддерживает все стандартные типы сообщений OpenAI, инструменты, responses и форматы streaming. Подробнее об обработке сообщений, конвертации инструментов, responses и streaming — см. OpenAI Chat Completions.


2. Responses API

Meridian конвертирует формат Responses API в Chat Completions внутренне, а затем конвертирует ответ обратно:

BifrostResponsesRequest
  → ToChatRequest()
  → ChatCompletion
  → ToBifrostResponsesResponse()

Поддержка параметров та же, что у Chat Completions, с различиями в формате ответа (output items вместо message content).


3. Text Completions

Cerebras поддерживает legacy text completion API:

ПараметрМаппинг
promptПередаётся как есть
max_tokensmax_tokens
temperaturetemperature
top_ptop_p
stopstop sequences

Ответ возвращает choices[].text с текстом completion.


4. Text Completions Streaming

Streaming text completions использует тот же SSE-формат, что и chat streaming.


5. List Models

Возвращает список доступных моделей Cerebras с информацией о возможностях и длине контекста.


Неподдерживаемые фичи

ФичаПричина
EmbeddingНе предлагается Cerebras API
Image GenerationНе предлагается Cerebras API
Speech/TTSНе предлагается Cerebras API
Transcription/STTНе предлагается Cerebras API
Batch OperationsНе предлагается Cerebras API
File ManagementНе предлагается Cerebras API

Нюансы

Содержание