Стриминг работает по стандартному Anthropic SSE-протоколу. Полная совместимость с Anthropic SDK — просто передайтеDocumentation Index
Fetch the complete documentation index at: https://docs.apiclaudecode.cloud/llms.txt
Use this file to discover all available pages before exploring further.
stream: true.
Пример
События
В порядке появления:message_start—{ id, model, role, usage: { input_tokens: N } }content_block_start— открытие блока (text/tool_use/thinking)content_block_delta— пошагово дописывает блокcontent_block_stop— блок закрытmessage_delta— финальныйstop_reason+output_tokensmessage_stop— конец стрима
Особенности на нашей стороне
Cloudflare у нас настроен на bypass cache + disable rocket-loader для пути
/v1/*, так что SSE передаётся bit-exact, без буферизации.Закрытие стрима пораньше
Просто закройте соединение клиента. Сервер прекратит генерацию. Спишется только то, что успели сгенерировать (output_tokens к моменту
закрытия).
Streaming + tools
tool_use-блок придёт по тому же SSE — content_block_start с type: "tool_use",
далее input_json_delta-фрагменты, потом content_block_stop с накопленным
input. После этого вы как обычно прокидываете tool_result в следующее
сообщение.