Инструмент Claude Advisor: сочетайте быстрого исполнителя с более умным планировщиком.
Инструмент Advisor позволяет Sonnet называть Opus среднего поколения для стратегического руководства. Один запрос API, две модели, качество, близкое к Opus, по цене Sonnet.
У вас есть агент кодирования, на котором работает Sonnet. Он без труда справляется с 90% операций: чтение файлов, запуск тестов, написание шаблона. Но когда дело доходит до грубого архитектурного решения или тонкого параллелизма ошибка, вы бы хотели, чтобы она могла позвонить другу.
Это инструмент-советник. Новая бета-версия API Anthropic позволяет использовать более быструю модель исполнителя (Sonnet или Haiku). назвать модель советника с более высоким интеллектом (Opus) среднего поколения. Консультант читает полную стенограмму, производит краткий план или корректировку курса, и исполнитель продолжает выполнение задания. Один запрос API, две модели, качество близкое к Opus по цене Sonnet.
Как работает инструмент-советник
Когда вы добавляете инструмент-советник в свой tools массив, исполнитель решает, когда его вызывать,
как и любой другой инструмент. Поток:
- Исполнитель выдает
server_tool_useблокировать сname: "advisor"и пустойinput. - Anthropic запускает отдельный проход вывода на стороне сервера модели советника, передавая полную расшифровку исполнителя (системное приглашение, определения инструментов, все предыдущие ходы и результаты).
- Ответ советника возвращается в виде
advisor_tool_resultблок (обычно от 400 до 700 текстовых токенов). - Исполнитель продолжает генерацию, руководствуясь советом.
Все это происходит внутри одного /v1/messages запрос. Никаких дополнительных поездок туда и обратно с вашей стороны.
Советник работает без инструментов и без управления контекстом; его мыслительные блоки отброшены и только
текст консультации доходит до исполнителя.
Ваш первый вызов консультанта: Curl, Python и TypeScript
Инструмент советника находится в стадии бета-тестирования. Включите advisor-tool-2026-03-01 бета-заголовок в ваших запросах.
Вот самый простой возможный вызов:
завиток
curl https://api.anthropic.com/v1/messages \\
--header "x-api-key: \$ANTHROPIC_API_KEY" \\
--header "anthropic-version: 2023-06-01" \\
--header "anthropic-beta: advisor-tool-2026-03-01" \\
--header "content-type: application/json" \\
--data '{
"model": "claude-sonnet-4-6",
"max_tokens": 4096,
"tools": [
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6"
}
],
"messages": [{
"role": "user",
"content": "Build a concurrent worker pool in Go with graceful shutdown."
}]
}'
Питон
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=4096,
betas=["advisor-tool-2026-03-01"],
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
}
],
messages=[
{
"role": "user",
"content": "Build a concurrent worker pool in Go with graceful shutdown.",
}
],
)
print(response)
Машинопись
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic();
const response = await client.beta.messages.create({
model: "claude-sonnet-4-6",
max_tokens: 4096,
betas: ["advisor-tool-2026-03-01"],
tools: [
{
type: "advisor_20260301",
name: "advisor",
model: "claude-opus-4-6",
},
],
messages: [
{
role: "user",
content: "Build a concurrent worker pool in Go with graceful shutdown.",
},
],
});
console.log(response);
Как выглядит ответ
Успешный вызов советника создает четыре блока контента: исходный текст исполнителя,
server_tool_use блок, advisor_tool_result блок, а исполнитель
окончательный результат, основанный на совете.
{
"role": "assistant",
"content": [
{
"type": "text",
"text": "Let me consult the advisor on this."
},
{
"type": "server_tool_use",
"id": "srvtoolu_abc123",
"name": "advisor",
"input": {}
},
{
"type": "advisor_tool_result",
"tool_use_id": "srvtoolu_abc123",
"content": {
"type": "advisor_result",
"text": "Use a channel-based coordination pattern. Close the input channel first, then wait on a WaitGroup..."
}
},
{
"type": "text",
"text": "Here's the implementation using a channel-based coordination pattern..."
}
]
}
The advisor_tool_result контент имеет два варианта: advisor_result с открытым текстом
совет и advisor_redacted_result с зашифрованным содержимым. В обоих случаях туда и обратно
содержание дословно на последующих поворотах.
Допустимые пары моделей
Советник должен быть по крайней мере таким же способным, как и исполнитель. Недопустимые пары возвращают 400 ошибка.
| Исполнитель | Советник |
|---|---|
| Клод Хайку 4.5 | Закрыть работу 4.6 |
| Клод Сонет 4.6 | Закрыть работу 4.6 |
| Закрыть работу 4.6 | Закрыть работу 4.6 |
Лучшее место для большинства рабочих нагрузок: Sonnet в качестве исполнителя, Opus в качестве советника. Вы получаете качественный лифт в аналогичная или более низкая общая стоимость по сравнению с запуском Opus для каждого токена.
Многоходовые разговоры
Передайте полный контент помощника, включая advisor_tool_result блоки, вернемся к API на
последующие ходы. Если вы опустите инструмент-советник из tools на последующем ходу, в то время как
история сообщений все еще содержит advisor_tool_result блоков API возвращает 400.
import anthropic
client = anthropic.Anthropic()
tools = [
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
}
]
messages = [
{
"role": "user",
"content": "Build a concurrent worker pool in Go with graceful shutdown.",
}
]
# First turn: executor calls advisor, builds the worker pool
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=4096,
betas=["advisor-tool-2026-03-01"],
tools=tools,
messages=messages,
)
# Pass back the full response content (including advisor_tool_result blocks)
messages.append({"role": "assistant", "content": response.content})
messages.append({"role": "user", "content": "Now add a max-in-flight limit of 10."})
# Second turn: executor has context from first advisor call
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=4096,
betas=["advisor-tool-2026-03-01"],
tools=tools,
messages=messages,
)
Оперативная разработка агентов кодирования
Инструмент-советник поставляется со встроенным описанием, которое побуждает исполнителя вызвать его в начале. сложных задач. Для рабочих нагрузок кодирования и агентов вы можете улучшить результаты с помощью системного приглашения, которое усиливает два тайминга:
- Ранний первый звонок консультанта после нескольких ознакомительных чтений в стенограмме.
- Последний вызов консультанта после записи файла и результаты тестирования указаны в расшифровке.
Вот шаблон системных подсказок, который Anthropic рекомендует для задач кодирования. Это произвело самый высокий разведка по цене, близкой к Сонету, во внутренних оценках:
You have access to an \`advisor\` tool backed by a stronger reviewer model.
It takes NO parameters. When you call advisor(), your entire conversation
history is automatically forwarded.
Call advisor BEFORE substantive work: before writing, before committing
to an interpretation, before building on an assumption.
Also call advisor:
- When you believe the task is complete (save your deliverable first)
- When stuck: errors recurring, approach not converging
- When considering a change of approach
The advisor should respond in under 100 words and use enumerated steps,
not explanations.
Урезаем выходные токены на 35-45%: Добавление «Консультант должен ответить менее чем в 100 словах». и используйте перечисленные шаги, а не объяснения» для приглашения вашей системы, что сокращает вывод советника без изменение частоты звонков. Соедините его с блоком синхронизации, чтобы получить наилучшее соотношение цены и качества.
Сочетание с другими инструментами
Инструмент-советник объединяет в себе веб-поиск, выполнение кода и ваши пользовательские инструменты в одном и том же месте.
tools множество. Исполнитель может осуществлять поиск в Интернете, вызывать консультанта и использовать ваши инструменты в
тот же поворот. План советника может сообщить, к каким инструментам исполнитель обратится в следующий раз.
tools = [
{
"type": "web_search_20250305",
"name": "web_search",
"max_uses": 5,
},
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
},
{
"name": "run_bash",
"description": "Run a bash command",
"input_schema": {
"type": "object",
"properties": {"command": {"type": "string"}},
},
},
]
Кэширование подсказок советника
Доступны два независимых уровня кэширования. Кэширование на стороне исполнителя работает так же, как и любой блок контента:
разместить cache_control точка останова после advisor_tool_result и это попадает.
Кэширование на стороне консультанта позволяет кэшировать стенограмму советника для всех вызовов в рамках одного разговора.
Включите его с помощью caching поле в определении инструмента:
tools = [
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"caching": {"type": "ephemeral", "ttl": "5m"},
}
]
Запись в кэш обходится дороже, чем экономия на чтение, когда советник вызывается два или меньше раз. Кэширование прекращается примерно после трех вызовов советника и после этого улучшается. Включите его надолго циклы агентов; оставьте его выключенным для коротких задач.
Разбивка по использованию и выставлению счетов
Вызовы советника выполняются как отдельный дополнительный вывод, оплачиваемый по тарифам модели советника.
usage.iterations массив дает вам разбивку по итерациям:
{
"usage": {
"input_tokens": 412,
"cache_read_input_tokens": 0,
"cache_creation_input_tokens": 0,
"output_tokens": 531,
"iterations": [
{
"type": "message",
"input_tokens": 412,
"output_tokens": 89
},
{
"type": "advisor_message",
"model": "claude-opus-4-6",
"input_tokens": 823,
"output_tokens": 1612
},
{
"type": "message",
"input_tokens": 1348,
"cache_read_input_tokens": 412,
"output_tokens": 442
}
]
}
}
Верхний уровень usage поля отражают только токены исполнителя. Итерации с
type: "advisor_message" счета выставляются по тарифам модели советника. Используйте
iterations массив при построении логики отслеживания затрат.
Контроль затрат: ограничение вызовов консультантов
Инструмент-советник не имеет встроенного ограничения уровня разговора. Использовать max_uses на инструменте
определение лимитов на каждый запрос. Для ограничений на уровне разговора учитывайте количество вызовов на стороне клиента и
снимите советник, когда достигнете потолка:
# Track advisor calls client-side
advisor_count = 0
MAX_ADVISOR_CALLS = 5
for turn in conversation:
response = client.beta.messages.create(...)
# Count advisor calls in response
for block in response.content:
if block.type == "server_tool_use" and block.name == "advisor":
advisor_count += 1
if advisor_count >= MAX_ADVISOR_CALLS:
# Remove advisor tool and strip advisor_tool_result blocks
tools = [t for t in tools if t.get("name") != "advisor"]
for msg in messages:
if msg["role"] == "assistant":
msg["content"] = [
b for b in msg["content"]
if b.get("type") not in ("server_tool_use", "advisor_tool_result")
or b.get("name") != "advisor"
]
Обработка ошибок
Если вызов советника не удался, результат содержит advisor_tool_result_error с
error_code. Исполнитель видит ошибку и продолжает работу без совета; запрос
сам не выходит из строя.
| Код ошибки | Значение |
|---|---|
max_uses_exceeded |
Запрос дошел до max_uses ограничение на определение инструмента |
too_many_requests |
Дополнительный вывод советника был ограничен по скорости |
overloaded |
Советник достиг предела емкости |
prompt_too_long |
Транскрипт превысил контекстное окно модели советника |
execution_time_exceeded |
Тайм-аут дополнительного вывода советника истек |
Потоковое поведение
Подвывод советника не транслируется. Поток исполнителя приостанавливается, пока работает советник.
тогда полный advisor_tool_result прибывает в одиночку content_block_start
событие. Во время паузы сигналы проверки связи SSE срабатывают каждые 30 секунд. Запланируйте от 2 до 5 секунд
тишина на вызов консультанта, в зависимости от длины стенограммы.
Когда советник помогает (а когда нет)
| Хорошо подходит | Слабая посадка |
|---|---|
| Агенты кодирования с многоэтапным редактированием файлов | Одноходовые вопросы и ответы |
| Многоэтапные исследовательские конвейеры | Пользовательские интерфейсы выбора модели, в которых пользователи выбирают качество |
| Агенты, использующие компьютер, с ветвящимися решениями | Рабочие нагрузки, где каждый ход требует полного Opus |
| Конвейеры CI/CD со сложным тестовым анализом | Короткие, реактивные задачи, диктуемые результатами инструмента |
Совет по сочетанию усилий: Для задач по кодированию сочетайте исполнитель Sonnet со средними усилиями с советник Опуса. Это обеспечивает интеллект, сравнимый с Sonnet при стандартных усилиях, с меньшими затратами. Для достижения максимального интеллекта оставьте для исполнителя усилие по умолчанию.
Ограничения, которые следует знать
- Вывод советника не передается в потоковом режиме. Ожидайте паузы во время субвывода.
- Нет встроенного ограничения на количество звонков консультанта. Отслеживайте и ограничивайте их на стороне клиента.
max_tokensприменяется только к выводу исполнителя. Он не привязывает токены советника.- Уровень приоритета исполнителя не распространяется на советника; оно вам понадобится на обеих моделях.
- Функция находится в стадии бета-тестирования. Включать
anthropic-beta: advisor-tool-2026-03-01в каждом запросе.
FAQ
- Что такое инструмент Claude Advisor?
- Инструмент Advisor — это бета-функция API Claude, которая позволяет более быстрой модели исполнителя (Sonnet или Haiku) обращаться к модели советника с более высоким интеллектом (Opus) среднего поколения. Советник читает весь разговор, составляет план или исправление в 400–700 токенах, а исполнитель продолжает выполнение задания. Он выполняется внутри одного запроса /v1/messages без дополнительных обращений.
- Сколько стоит инструмент Claude Advisor?
- Вызовы консультанта выполняются как отдельный дополнительный вывод и оплачиваются по тарифам модели консультанта. Токены исполнителя выставляются по тарифу исполнителя. Поскольку советник производит от 400 до 700 токенов руководства вместо полного вывода, большая часть генерации токенов происходит по более низкой цене исполнителя. Сопряжение Sonnet в качестве исполнителя с Opus в качестве консультанта обеспечивает качество, близкое к Opus, при аналогичных или меньших общих затратах, чем использование одного Opus.
- Какие модели работают с Advisor Tool?
- Советник должен быть по крайней мере таким же способным, как и исполнитель. Допустимые пары: Haiku 4.5 с Opus 4.6, Sonnet 4.6 с Opus 4.6 и Opus 4.6 с Opus 4.6. Недопустимые пары возвращают ошибку 400.
- Поддерживает ли инструмент Advisor потоковую передачу?
- Поток исполнителя приостанавливается, пока советник выполняет дополнительный вывод. Когда советник завершает работу, полный советник_tool_result поступает в одном событии content_block_start, и потоковая передача результатов исполнителя возобновляется. Во время паузы отправляются сообщения проверки связи SSE.
- Когда мне не следует использовать Советник?
- Советник добавляет минимальную ценность для одноразовых вопросов и ответов, когда нечего планировать, пользовательских интерфейсов простого выбора модели, где пользователи сами выбирают компромисс между ценой и качеством, или рабочих нагрузок, где каждый ход требует всех возможностей модели советника. Он освещает долгосрочные агентские рабочие нагрузки: агенты кодирования, многоэтапные исследования и конвейеры CI.
Начните разработку с botoi
150+ API-эндпоинтов для поиска, обработки текста, генерации изображений и утилит для разработчиков. Бесплатный тариф, без банковской карты.