Конвертация Cerebras API в Meridian — полная OpenAI-совместимость, streaming, tool calling и обработка параметров.

Обзор

Cerebras — полностью OpenAI-совместимый провайдер, использующий весь набор фич OpenAI API. Meridian делегирует функциональность реализации OpenAI-провайдера со стандартной фильтрацией параметров. Ключевые характеристики:

Полная OpenAI-совместимость — поддержаны все chat, text и streaming фичи.
Полное tool calling — определения функций и параллельное исполнение инструментов.
Поддержка streaming — Server-Sent Events с трекингом использования токенов.
Сохранение параметров — пробрасываются все стандартные OpenAI-параметры.
Responses API — полная поддержка с конвертацией формата.

Поддерживаемые операции

Операция	Без стриминга	Стриминг	Эндпоинт
Chat Completions	✅	✅	`/v1/chat/completions`
Responses API	✅	✅	`/v1/chat/completions`
Text Completions	✅	✅	`/v1/completions`
List Models	✅	—	`/v1/models`
Embeddings	❌	❌	—
Image Generation	❌	❌	—
Speech (TTS)	❌	❌	—
Transcriptions (STT)	❌	❌	—
Files	❌	❌	—
Batch	❌	❌	—

Неподдерживаемые операции (❌): Embeddings, Image Generation, Speech, Transcriptions, Files и Batch не поддерживаются upstream-API Cerebras. Запросы к ним возвращают UnsupportedOperationError.

1. Chat Completions

Параметры запроса

Cerebras поддерживает все стандартные параметры OpenAI chat completions. Полный справочник параметров и поведение — на странице OpenAI Chat Completions.

Фильтруемые параметры

Удаляются для совместимости с Cerebras:

prompt_cache_key — не поддерживается;
verbosity — специфично для Anthropic;
store — не поддерживается;
service_tier — специфично для OpenAI.

Reasoning-параметр

Cerebras делегирует в OpenAI через ToOpenAIChatRequest, поэтому reasoning-параметры преобразуются: значения reasoning.effort (например, minimal → low) маппятся по конвенции OpenAI-совместимых провайдеров, а reasoning.max_tokens очищается/опускается (удаляется при конвертации).

Cerebras поддерживает все стандартные типы сообщений OpenAI, инструменты, responses и форматы streaming. Подробнее об обработке сообщений, конвертации инструментов, responses и streaming — см. OpenAI Chat Completions.

2. Responses API

Meridian конвертирует формат Responses API в Chat Completions внутренне, а затем конвертирует ответ обратно:

BifrostResponsesRequest
  → ToChatRequest()
  → ChatCompletion
  → ToBifrostResponsesResponse()

Поддержка параметров та же, что у Chat Completions, с различиями в формате ответа (output items вместо message content).

3. Text Completions

Cerebras поддерживает legacy text completion API:

Параметр	Маппинг
`prompt`	Передаётся как есть
`max_tokens`	max_tokens
`temperature`	temperature
`top_p`	top_p
`stop`	stop sequences

Ответ возвращает choices[].text с текстом completion.

4. Text Completions Streaming

Streaming text completions использует тот же SSE-формат, что и chat streaming.

5. List Models

Возвращает список доступных моделей Cerebras с информацией о возможностях и длине контекста.

Неподдерживаемые фичи

Фича	Причина
Embedding	Не предлагается Cerebras API
Image Generation	Не предлагается Cerebras API
Speech/TTS	Не предлагается Cerebras API
Transcription/STT	Не предлагается Cerebras API
Batch Operations	Не предлагается Cerebras API
File Management	Не предлагается Cerebras API

Cerebras