Langsung ke konten
Guide

Alat Penasihat Claude: pasangkan pelaksana yang cepat dengan perencana yang lebih cerdas

| 8 min read

Alat Penasihat memungkinkan Sonnet memanggil Opus generasi menengah untuk mendapatkan panduan strategis. Satu permintaan API, dua model, kualitas mendekati Opus dengan biaya Soneta.

AI brain visualization with neural network connections representing dual-model collaboration
Photo by Andrea De Santis on Unsplash

Anda memiliki agen pengkodean yang menjalankan Sonnet. Ia menangani 90% putaran tanpa bersusah payah: membaca file, menjalankan tes, menulis boilerplate. Namun ketika terjadi keputusan arsitektur yang rumit atau konkurensi yang halus bug, Anda berharap bisa menelepon teman.

Itu adalah Alat Penasihat. Fitur API beta baru Anthropic memungkinkan model pelaksana lebih cepat (Sonnet atau Haiku) sebut saja model penasihat intelijen tinggi (Opus) generasi menengah. Penasihat membaca transkrip lengkapnya, menghasilkan rencana singkat atau koreksi arah, dan pelaksana melanjutkan tugasnya. Satu permintaan API, dua model, kualitas mendekati Opus dengan harga Sonnet.

Cara kerja Alat Penasihat

Saat Anda menambahkan alat penasihat ke Anda tools array, pelaksana memutuskan kapan memanggilnya, seperti alat lainnya. Aliran:

  1. Pelaksana mengeluarkan a server_tool_use blok dengan name: "advisor" dan kosong input.
  2. Anthropic menjalankan jalur inferensi terpisah di sisi server model penasihat, meneruskan transkrip lengkap pelaksana (perintah sistem, definisi alat, semua putaran dan hasil sebelumnya).
  3. Tanggapan penasihat kembali sebagai advisor_tool_result blok (biasanya 400 hingga 700 token teks).
  4. Pelaksana terus menghasilkan, mendapat informasi dari saran tersebut.

Semua ini terjadi dalam satu kesatuan /v1/messages meminta. Tidak ada perjalanan bolak-balik tambahan di pihak Anda. Penasihat berjalan tanpa alat dan tanpa manajemen konteks; blok pemikirannya dihilangkan dan hanya itu teks nasehat sampai kepada pelaksana.

Panggilan penasihat pertama Anda: curl, Python, dan TypeScript

Alat penasihat masih dalam versi beta. Sertakan advisor-tool-2026-03-01 header beta dalam permintaan Anda. Inilah panggilan yang paling sederhana:

keriting

curl https://api.anthropic.com/v1/messages \\
  --header "x-api-key: \$ANTHROPIC_API_KEY" \\
  --header "anthropic-version: 2023-06-01" \\
  --header "anthropic-beta: advisor-tool-2026-03-01" \\
  --header "content-type: application/json" \\
  --data '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 4096,
    "tools": [
      {
        "type": "advisor_20260301",
        "name": "advisor",
        "model": "claude-opus-4-6"
      }
    ],
    "messages": [{
      "role": "user",
      "content": "Build a concurrent worker pool in Go with graceful shutdown."
    }]
  }'

ular piton

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    betas=["advisor-tool-2026-03-01"],
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
        }
    ],
    messages=[
        {
            "role": "user",
            "content": "Build a concurrent worker pool in Go with graceful shutdown.",
        }
    ],
)

print(response)

skrip ketikan

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic();

const response = await client.beta.messages.create({
  model: "claude-sonnet-4-6",
  max_tokens: 4096,
  betas: ["advisor-tool-2026-03-01"],
  tools: [
    {
      type: "advisor_20260301",
      name: "advisor",
      model: "claude-opus-4-6",
    },
  ],
  messages: [
    {
      role: "user",
      content: "Build a concurrent worker pool in Go with graceful shutdown.",
    },
  ],
});

console.log(response);

Seperti apa tanggapannya

Panggilan penasihat yang berhasil menghasilkan empat blok konten: teks awal pelaksana, the server_tool_use blok, itu advisor_tool_result blok, dan eksekutor hasil akhir diinformasikan oleh saran.

{
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Let me consult the advisor on this."
    },
    {
      "type": "server_tool_use",
      "id": "srvtoolu_abc123",
      "name": "advisor",
      "input": {}
    },
    {
      "type": "advisor_tool_result",
      "tool_use_id": "srvtoolu_abc123",
      "content": {
        "type": "advisor_result",
        "text": "Use a channel-based coordination pattern. Close the input channel first, then wait on a WaitGroup..."
      }
    },
    {
      "type": "text",
      "text": "Here's the implementation using a channel-based coordination pattern..."
    }
  ]
}

Itu advisor_tool_result konten memiliki dua varian: advisor_result dengan teks biasa saran, dan advisor_redacted_result dengan konten terenkripsi. Dalam kedua kasus tersebut, lakukan perjalanan pulang pergi konten kata demi kata pada giliran berikutnya.

Pasangan model yang valid

Penasihat harus setidaknya memiliki kemampuan yang sama dengan pelaksana. Pasangan yang tidak valid kembali a 400 kesalahan.

Pelaksana Penasihat
Claude Haiku 4.5 Tutup Pekerjaan 4.6
Claude Soneta 4.6 Tutup Pekerjaan 4.6
Tutup Pekerjaan 4.6 Tutup Pekerjaan 4.6

Titik terbaik untuk sebagian besar beban kerja: Soneta sebagai pelaksana, Opus sebagai penasihat. Anda mendapatkan tumpangan berkualitas total biaya yang sama atau lebih rendah dibandingkan menjalankan Opus untuk setiap token.

Percakapan multi-putaran

Lulus konten asisten lengkap, termasuk advisor_tool_result blok, kembali ke API aktif belokan berikutnya. Jika Anda menghilangkan alat penasihat dari tools pada giliran tindak lanjut sementara riwayat pesan masih berisi advisor_tool_result blok, API mengembalikan a 400.

import anthropic

client = anthropic.Anthropic()

tools = [
    {
        "type": "advisor_20260301",
        "name": "advisor",
        "model": "claude-opus-4-6",
    }
]

messages = [
    {
        "role": "user",
        "content": "Build a concurrent worker pool in Go with graceful shutdown.",
    }
]

# First turn: executor calls advisor, builds the worker pool
response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    betas=["advisor-tool-2026-03-01"],
    tools=tools,
    messages=messages,
)

# Pass back the full response content (including advisor_tool_result blocks)
messages.append({"role": "assistant", "content": response.content})
messages.append({"role": "user", "content": "Now add a max-in-flight limit of 10."})

# Second turn: executor has context from first advisor call
response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    betas=["advisor-tool-2026-03-01"],
    tools=tools,
    messages=messages,
)

Rekayasa cepat untuk agen pengkodean

Alat penasihat dikirimkan dengan deskripsi bawaan yang mendorong pelaksana untuk menghentikannya di dekat awal dari tugas-tugas yang kompleks. Untuk beban kerja pengkodean dan agen, Anda dapat meningkatkan hasil dengan prompt sistem itu memperkuat dua timing:

  • Panggilan penasihat awal yang pertama, setelah beberapa bacaan eksplorasi ada di transkrip
  • Panggilan penasihat terakhir setelah penulisan file dan hasil pengujian ada dalam transkrip

Berikut pola prompt sistem yang direkomendasikan Anthropic untuk tugas pengkodean. Ini menghasilkan yang tertinggi intelijen dengan biaya mendekati Soneta dalam evaluasi internal:

You have access to an \`advisor\` tool backed by a stronger reviewer model.
It takes NO parameters. When you call advisor(), your entire conversation
history is automatically forwarded.

Call advisor BEFORE substantive work: before writing, before committing
to an interpretation, before building on an assumption.

Also call advisor:
- When you believe the task is complete (save your deliverable first)
- When stuck: errors recurring, approach not converging
- When considering a change of approach

The advisor should respond in under 100 words and use enumerated steps,
not explanations.

Pangkas token keluaran sebesar 35-45%: Menambahkan "Penasihat harus merespons kurang dari 100 kata dan gunakan langkah-langkah yang disebutkan, bukan penjelasan" pada prompt sistem Anda, tanpa mengeluarkan keluaran penasihat mengubah frekuensi panggilan. Pasangkan dengan blok waktu untuk menghasilkan tradeoff biaya-versus-kualitas yang paling kuat.

Menggabungkan dengan alat lain

Alat penasihat terdiri dari pencarian web, eksekusi kode, dan alat khusus Anda di dalamnya tools susunan. Pelaksana dapat mencari di web, menghubungi penasihat, dan menggunakan alat Anda giliran yang sama. Rencana penasihat dapat menginformasikan alat mana yang akan digunakan oleh pelaksana selanjutnya.

tools = [
    {
        "type": "web_search_20250305",
        "name": "web_search",
        "max_uses": 5,
    },
    {
        "type": "advisor_20260301",
        "name": "advisor",
        "model": "claude-opus-4-6",
    },
    {
        "name": "run_bash",
        "description": "Run a bash command",
        "input_schema": {
            "type": "object",
            "properties": {"command": {"type": "string"}},
        },
    },
]

Caching cepat penasihat

Tersedia dua lapisan caching independen. Caching sisi pelaksana berfungsi sama seperti blok konten mana pun: tempat a cache_control breakpoint setelah an advisor_tool_result dan itu mengenai.

Cache sisi penasihat menyimpan transkrip penasihat dalam cache di seluruh panggilan dalam percakapan yang sama. Aktifkan dengan a caching bidang pada definisi alat:

tools = [
    {
        "type": "advisor_20260301",
        "name": "advisor",
        "model": "claude-opus-4-6",
        "caching": {"type": "ephemeral", "ttl": "5m"},
    }
]

Biaya penulisan cache lebih mahal daripada penyimpanan baca ketika penasihat dipanggil dua kali atau lebih sedikit. Caching mencapai titik impas pada sekitar tiga panggilan penasihat dan meningkat dari sana. Aktifkan untuk waktu yang lama loop agen; simpan untuk tugas-tugas singkat.

Rincian penggunaan dan penagihan

Panggilan penasihat dijalankan sebagai sub-inferensi terpisah yang dikenakan tarif model penasihat. Itu usage.iterations array memberi Anda perincian per iterasi:

{
  "usage": {
    "input_tokens": 412,
    "cache_read_input_tokens": 0,
    "cache_creation_input_tokens": 0,
    "output_tokens": 531,
    "iterations": [
      {
        "type": "message",
        "input_tokens": 412,
        "output_tokens": 89
      },
      {
        "type": "advisor_message",
        "model": "claude-opus-4-6",
        "input_tokens": 823,
        "output_tokens": 1612
      },
      {
        "type": "message",
        "input_tokens": 1348,
        "cache_read_input_tokens": 412,
        "output_tokens": 442
      }
    ]
  }
}

Tingkat atas usage bidang mencerminkan token pelaksana saja. Iterasi dengan type: "advisor_message" ditagih berdasarkan tarif model penasihat. Gunakan iterations array saat membangun logika pelacakan biaya.

Pengendalian biaya: membatasi panggilan penasihat

Alat penasihat tidak memiliki batasan tingkat percakapan bawaan. Menggunakan max_uses pada alat tersebut definisi untuk batas per permintaan. Untuk batasan tingkat percakapan, hitung panggilan di sisi klien dan lepaskan penasihat saat Anda mencapai batas tertinggi:

# Track advisor calls client-side
advisor_count = 0
MAX_ADVISOR_CALLS = 5

for turn in conversation:
    response = client.beta.messages.create(...)

    # Count advisor calls in response
    for block in response.content:
        if block.type == "server_tool_use" and block.name == "advisor":
            advisor_count += 1

    if advisor_count >= MAX_ADVISOR_CALLS:
        # Remove advisor tool and strip advisor_tool_result blocks
        tools = [t for t in tools if t.get("name") != "advisor"]
        for msg in messages:
            if msg["role"] == "assistant":
                msg["content"] = [
                    b for b in msg["content"]
                    if b.get("type") not in ("server_tool_use", "advisor_tool_result")
                    or b.get("name") != "advisor"
                ]

Penanganan kesalahan

Jika panggilan penasihat gagal, hasilnya adalah advisor_tool_result_error dengan sebuah error_code. Pelaksana melihat kesalahannya dan melanjutkan tanpa nasihat; permintaan tersebut sendiri tidak gagal.

Kode kesalahan Arti
max_uses_exceeded Permintaan mencapai max_uses membatasi definisi alat
too_many_requests Sub-inferensi penasihat memiliki tarif terbatas
overloaded Penasihat mencapai batas kapasitas
prompt_too_long Transkrip melebihi jendela konteks model penasihat
execution_time_exceeded Waktu sub-inferensi penasihat habis

Perilaku streaming

Sub-inferensi penasihat tidak mengalir. Aliran eksekutor berhenti sementara penasihat berjalan, lalu penuh advisor_tool_result tiba dalam satu content_block_start peristiwa. Ping SSE tetap menyala setiap 30 detik selama jeda. Rencanakan selama 2 hingga 5 detik keheningan per panggilan penasihat, tergantung pada panjang transkrip.

Ketika penasihat membantu (dan kapan tidak)

Cocok sekali Kecocokan yang lemah
Agen pengkodean dengan pengeditan file multi-langkah Tanya Jawab satu putaran
Jalur penelitian multi-langkah UI pemilih model tempat pengguna memilih kualitas
Agen penggunaan komputer dengan keputusan bercabang Beban kerja yang setiap giliran membutuhkan Opus penuh
Pipeline CI/CD dengan analisis pengujian yang kompleks Tugas singkat dan reaktif ditentukan oleh keluaran alat

Tip upaya memasangkan: Untuk tugas pengkodean, pasangkan eksekutor Soneta dengan upaya sedang seorang penasihat Opus. Hal ini mencapai kecerdasan yang sebanding dengan Soneta pada upaya default, dengan biaya lebih rendah. Untuk kecerdasan maksimal, jaga agar eksekutor tetap pada upaya default.

Batasan yang perlu diketahui

  • Output penasihat tidak mengalir. Harapkan jeda selama sub-inferensi.
  • Tidak ada batasan tingkat percakapan pada panggilan penasihat. Lacak dan batasi di sisi klien.
  • max_tokens berlaku untuk keluaran eksekutor saja. Itu tidak mengikat token penasihat.
  • Tingkat Prioritas pada pelaksana tidak mencakup penasihat; Anda membutuhkannya di kedua model.
  • Fitur ini masih dalam versi beta. Termasuk anthropic-beta: advisor-tool-2026-03-01 dalam setiap permintaan.

FAQ

Apa itu Alat Penasihat Claude?
Alat Penasihat adalah fitur beta di API Claude yang memungkinkan model pelaksana yang lebih cepat (Sonnet atau Haiku) berkonsultasi dengan model penasihat kecerdasan tinggi (Opus) generasi menengah. Penasihat membaca percakapan lengkap, membuat rencana atau koreksi dalam 400 hingga 700 token, dan pelaksana melanjutkan tugasnya. Ini berjalan di dalam satu permintaan /v1/messages tanpa perjalanan bolak-balik tambahan.
Berapa harga Alat Penasihat Claude?
Panggilan penasihat dijalankan sebagai sub-inferensi terpisah yang ditagihkan berdasarkan tarif model penasihat. Token eksekutor ditagih sesuai tarif eksekutor. Karena penasihat menghasilkan 400 hingga 700 token panduan, bukan output penuh, sebagian besar pembuatan token terjadi pada tingkat pelaksana yang lebih murah. Memasangkan Sonnet sebagai pelaksana dengan Opus sebagai penasihat menghasilkan kualitas yang mendekati Opus dengan total biaya yang sama atau lebih rendah dibandingkan menjalankan Opus sendirian.
Model manakah yang dapat digunakan dengan Alat Penasihat?
Penasihat harus setidaknya memiliki kemampuan yang sama dengan pelaksana. Pasangan yang valid: Haiku 4.5 dengan Opus 4.6, Sonnet 4.6 dengan Opus 4.6, dan Opus 4.6 dengan Opus 4.6. Pasangan yang tidak valid menghasilkan kesalahan 400.
Apakah Alat Penasihat mendukung streaming?
Aliran eksekutor dijeda sementara penasihat menjalankan sub-inferensinya. Ketika penasihat selesai, Advisor_tool_result lengkap tiba dalam satu peristiwa content_block_start, dan keluaran pelaksana melanjutkan streaming. Keepalives ping SSE dikirim selama jeda.
Kapan saya sebaiknya tidak menggunakan Alat Penasihat?
Penasihat menambahkan nilai minimal untuk Tanya Jawab satu putaran ketika tidak ada apa pun yang perlu direncanakan, UI pemilih model murni ketika pengguna memilih trade-off biaya dan kualitasnya sendiri, atau beban kerja ketika setiap giliran memerlukan kemampuan penuh model penasihat. Ini menonjol pada beban kerja agen jangka panjang: agen pengkodean, penelitian multi-langkah, dan saluran CI.

Mulai membangun dengan botoi

150+ endpoint API untuk pencarian, pemrosesan teks, pembuatan gambar, dan utilitas developer. Paket gratis, tanpa kartu kredit.