Cerebras
Конвертация Cerebras API в Meridian — полная OpenAI-совместимость, streaming, tool calling и обработка параметров.
Обзор
Cerebras — полностью OpenAI-совместимый провайдер, использующий весь набор фич OpenAI API. Meridian делегирует функциональность реализации OpenAI-провайдера со стандартной фильтрацией параметров. Ключевые характеристики:
- Полная OpenAI-совместимость — поддержаны все chat, text и streaming фичи.
- Полное tool calling — определения функций и параллельное исполнение инструментов.
- Поддержка streaming — Server-Sent Events с трекингом использования токенов.
- Сохранение параметров — пробрасываются все стандартные OpenAI-параметры.
- Responses API — полная поддержка с конвертацией формата.
Поддерживаемые операции
| Операция | Без стриминга | Стриминг | Эндпоинт |
|---|---|---|---|
| Chat Completions | ✅ | ✅ | /v1/chat/completions |
| Responses API | ✅ | ✅ | /v1/chat/completions |
| Text Completions | ✅ | ✅ | /v1/completions |
| List Models | ✅ | — | /v1/models |
| Embeddings | ❌ | ❌ | — |
| Image Generation | ❌ | ❌ | — |
| Speech (TTS) | ❌ | ❌ | — |
| Transcriptions (STT) | ❌ | ❌ | — |
| Files | ❌ | ❌ | — |
| Batch | ❌ | ❌ | — |
Неподдерживаемые операции (❌): Embeddings, Image Generation, Speech, Transcriptions, Files и Batch не поддерживаются upstream-API Cerebras. Запросы к ним возвращают UnsupportedOperationError.
1. Chat Completions
Параметры запроса
Cerebras поддерживает все стандартные параметры OpenAI chat completions. Полный справочник параметров и поведение — на странице OpenAI Chat Completions.
Фильтруемые параметры
Удаляются для совместимости с Cerebras:
prompt_cache_key— не поддерживается;verbosity— специфично для Anthropic;store— не поддерживается;service_tier— специфично для OpenAI.
Reasoning-параметр
Cerebras делегирует в OpenAI через ToOpenAIChatRequest, поэтому reasoning-параметры преобразуются: значения reasoning.effort (например, minimal → low) маппятся по конвенции OpenAI-совместимых провайдеров, а reasoning.max_tokens очищается/опускается (удаляется при конвертации).
Cerebras поддерживает все стандартные типы сообщений OpenAI, инструменты, responses и форматы streaming. Подробнее об обработке сообщений, конвертации инструментов, responses и streaming — см. OpenAI Chat Completions.
2. Responses API
Meridian конвертирует формат Responses API в Chat Completions внутренне, а затем конвертирует ответ обратно:
BifrostResponsesRequest
→ ToChatRequest()
→ ChatCompletion
→ ToBifrostResponsesResponse()Поддержка параметров та же, что у Chat Completions, с различиями в формате ответа (output items вместо message content).
3. Text Completions
Cerebras поддерживает legacy text completion API:
| Параметр | Маппинг |
|---|---|
prompt | Передаётся как есть |
max_tokens | max_tokens |
temperature | temperature |
top_p | top_p |
stop | stop sequences |
Ответ возвращает choices[].text с текстом completion.
4. Text Completions Streaming
Streaming text completions использует тот же SSE-формат, что и chat streaming.
5. List Models
Возвращает список доступных моделей Cerebras с информацией о возможностях и длине контекста.
Неподдерживаемые фичи
| Фича | Причина |
|---|---|
| Embedding | Не предлагается Cerebras API |
| Image Generation | Не предлагается Cerebras API |
| Speech/TTS | Не предлагается Cerebras API |
| Transcription/STT | Не предлагается Cerebras API |
| Batch Operations | Не предлагается Cerebras API |
| File Management | Не предлагается Cerebras API |
Нюансы
AWS Bedrock
Конвертация AWS Bedrock API в Meridian — семейства моделей, маппинг параметров, обработка сообщений, reasoning/thinking, преобразование инструментов и AWS-аутентификация.
Cohere
Конвертация Cohere API в Meridian — маппинг параметров, обработка сообщений, reasoning/thinking и преобразование инструментов.