Cloudflare Code Mode MCP: توقف عن دفع مليون رمز لوصف أدواتك
قامت Cloudflare بخفض تعريفات أداة MCP من 1.17 مليون رمز مميز إلى 1K من خلال السماح للوكلاء بكتابة التعليمات البرمجية على سطح واجهة برمجة التطبيقات (API) المكتوب. إليك كيفية عمل النمط ومتى يتم استخدامه.
يحرق خادم MCP المكون من 49 أداة حوالي 29000 رمز إدخال قبل أن يكتب المستخدم حرفًا واحدًا. خادم مكون من 2500 أداة، وهو ما يشحنه Cloudflare داخليًا تقريبًا، يحرق 1.17 مليون أداة. ذلك هي نافذة الإدخال الكاملة التي قضاها كلود أوبوس في وصف الأدوات، وليس حل مشكلة المستخدم. كل دور يدفع الفاتورة مرة أخرى. كل إعادة محاولة يدفعها مرة أخرى. على نطاق واسع، البند ل تتجاوز "تعريفات الأداة" بند "العمل الفعلي".
في أبريل 2026، تم شحن Cloudflare وضع الكود MCPوهو النمط الذي ينهار ذلك 1.17 مليون رمز مميز لحوالي 1000 رمز، بتخفيض بنسبة 99.9%. الحيلة بسيطة: توقف وصف الأدوات للنموذج. امنح النموذج واجهة برمجة تطبيقات مكتوبة وصندوق حماية، ودعه يكتب ملف الكود الذي يستدعي الأدوات هذا هو السبب وراء تسرب الرموز المميزة للنمط الكلاسيكي، وكيفية إصلاح وضع Code له، ومتى يجب أن تهتم بالتبديل.
مشكلة الرمز المميز 1.17M
يرسل Classic MCP تعريفات الأداة كجزء من سياق النظام عند كل طلب. كل أداة يحمل اسمًا ووصفًا ومخطط إدخال، وغالبًا ما يكون مخطط إخراج. مثال مدمج تبدو أداة البحث عن الطقس كما يلي:
يعمل هذا المخطط الواحد على تشغيل حوالي 600 رمز بمجرد حساب الحمل الهيكلي لـ JSON، وهو الأوصاف التي يحتاجها النموذج لاختيار الأداة وقيم التعداد. اضرب في 49 برعاية الأدوات الموجودة على خادم MCP الخاص بـ botoi وتصل إلى ما يقرب من 29400 رمزًا في كل دور. 10 دورة المحادثة تدفع ذلك 10 مرات، لأن النموذج ليس لديه ذاكرة بين المنعطفات و يقوم المنسق بشحن الحزمة بأكملها في كل مرة. قم بتوسيع عدد الأدوات إلى Cloudflare الكامل سطح واجهة برمجة التطبيقات الداخلي (حوالي 2500 نقطة نهاية) وتصل تكلفة كل دورة إلى 1.17 مليون رمز مميز، الذي يفيض حتى نافذة Opus ذات الرمز المميز الواحد.
عد البصمة الخاصة بك في مكالمة واحدة. يقبل عداد الرمز المميز الخاص بـ Botoi أي سلسلة؛ أطعمه أ مخطط الأداة وستحصل على عدد الرموز المميزة الأنثروبي الدقيق:
كيف يقلب Code Mode MCP النمط
لا يقرأ البشر مخططات واجهة برمجة التطبيقات (API) قبل كل مكالمة. تقرأ المستندات مرة واحدة، وتفتح محررًا، و كتابة التعليمات البرمجية التي تستورد الوظائف. وقت التشغيل يعالج الإرسال. وضع الكود يمنح النموذج نفس الإعداد.
يعمل الوكيل داخل V8 المعزول (صندوق حماية Cloudflare's Workers). تظهر أدوات MCP كما كتبت وظائف على كائن مستورد. يرى النموذج تعريف نوع TypeScript، وليس JSON بث المخطط. عندما يسأل المستخدم "ما هي نوعية الهواء الذي أعيش فيه"، يكتب النموذج أ برنامج قصير:
// The agent writes this. The runtime compiles and executes it.
// Only the two functions it calls ever hit the wire.
import { botoi } from "@botoi/mcp";
export async function run(input: { city: string }) {
const weather = await botoi.weather.current({ city: input.city });
const air = await botoi.airQuality.check({
lat: weather.lat,
lon: weather.lon,
});
return {
city: input.city,
temp: weather.temp_c,
aqi: air.aqi,
advice: air.aqi > 100 ? "stay inside" : "go for a walk",
};
}
يقوم وقت التشغيل بتجميع المقتطف، وتشغيله داخل العزلة، ويعمل به الاثنان فقط
في الواقع يدعو (botoi.weather.current و botoi.airQuality.check)
المس الشبكة. لم ير النموذج أبدًا مخططًا للأدوات الـ 47 الأخرى، لأنه لم يحدث أبدًا
هناك حاجة ل. يقع ملف النوع على القرص مرة واحدة ويبلغ المترجم، وليس نافذة السياق.
يعتبر وضع Code Mode أقرب إلى كيفية كتابة برنامج نصي مقابل SDK من كيفية قيادة النموذج. مخرجات النموذج هي التعليمات البرمجية، ومهمة وقت التشغيل هي تنفيذ التعليمات البرمجية بأمان، وتكلفة الشبكة خرائط للمكالمات الحقيقية بدلاً من المكالمات الافتراضية.
الرياضيات على خادم botoi المكون من 49 أداة
يعرض خادم Botoi's MCP 49 أداة منسقة عبر البحث والنص والمطور والصورة والأمان الفئات. يقارن الجدول أدناه MCP الكلاسيكي بوضع Code Mode لأحمال العمل النموذجية: محادثات ذات 10 دورات، 10000 محادثة شهريًا، تسعير مدخلات Opus.
| متري | الكلاسيكية MCP | وضع الكود MCP |
|---|---|---|
| الرموز لكل دور (أوصاف الأداة) | 29,400 | 0 (اكتب الملف الذي تم تحميله مرة واحدة) |
| الحمل السطحي من النوع البارد | 0 | ~1000 رمز |
| 10-دور تكلفة المحادثة في الأوصاف | 294.000 قطعة | 1000 رمز |
| وضع الفشل الأساسي | يختار النموذج أداة خاطئة | يتم طرح التعليمات البرمجية التي تم إنشاؤها في وقت التشغيل |
| قابلية التصحيح | تتبع استدعاء الأداة | تتبع المكدس بالإضافة إلى تتبع استدعاء الأداة |
| حالة الاستخدام الأفضل | <10 أدوات، عملاء سطح المكتب | أكثر من 50 أداة وسير عمل متعدد الخطوات |
| وأضاف الكمون | لا أحد | 10-50 مللي ثانية تجميع + عزل بدء التشغيل |
بمعدلات إدخال Opus (حوالي 15 دولارًا لكل مليون رمز)، يكلف النمط الكلاسيكي حوالي 0.44 دولارًا لكل مليون رمز. 10-أدر المحادثة في رموز وصف الأداة وحدها. يقوم وضع Code بإسقاط ذلك إلى أجزاء من a المائة. عبر 10000 محادثة شهريًا، يمكنك توفير حوالي 4400 دولار واسترداد 2.9 مليار دولار رموز ميزانية السياق للعمل الذي يهم.
قم بقياس الخادم الخاص بك اليوم قبل الالتزام بأي من النمطين:
عندما يكون وضع Code يستحق ذلك، عندما لا يكون كذلك
وضع الكود ليس مجانيًا. يضيف وضع الحماية من 10 إلى 50 مللي ثانية من عملية الترجمة والعزل لبدء التشغيل لكل دورة. يمكن أن يتم طرح التعليمات البرمجية التي تم إنشاؤها، مما يعني أنك بحاجة إلى منطق إعادة المحاولة ومسار احتياطي. يتحول تصحيح الأخطاء من "اختار النموذج الأداة الخاطئة" إلى "قام النموذج بكتابة التعليمات البرمجية التي أشار إلى رمز غير محدد." يحتاج مكدس إمكانية المراقبة الخاص بك إلى التقاط كل من الكود المصدري وتستدعي الأداة تشغيلها.
التزم بـ MCP الكلاسيكي عندما:
- يمكنك الكشف عن أقل من 10 أدوات ويكون أثر المخطط أقل من 6000 رمز مميز.
- عميلك المستهدف هو Claude Desktop، أو Cursor، أو VS Code (يتحدثون فقط MCP الكلاسيكي).
- حلقة الوكيل عبارة عن لقطة واحدة: رسالة مستخدم واحدة، واستدعاء أداة واحدة، واستجابة واحدة.
- ميزانيات وقت الاستجابة محدودة ولا يمكنك قضاء 10-50 مللي ثانية في التجميع.
قم بالتبديل إلى وضع الكود عندما:
- إذا كشفت عن 50 أداة أو أكثر، أو تجاوزت بصمة المخطط الخاص بك 15000 رمزًا مميزًا.
- تستدعي أدوات سلسلة سير العمل 3+، لأن وضع Code يتجنب إعادة وصف الأدوات في كل قفزة.
- أنت تمتلك وقت التشغيل (Cloudflare Agents، وMastra، وLangGraph) ويمكنك تجميع مخرجات الوكيل.
- يقرأ أكبر بند في مشروع القانون الإنساني "رموز إدخال النظام".
مسار ترحيل دون إعادة كتابة الخادم الخاص بك
ليس عليك اختيار نمط واحد. يجب على معظم الفرق تشغيل كليهما وتوجيه العملاء حسب القدرة. فيما يلي مسار من ثلاث خطوات يتجنب إعادة كتابة خادم MCP الخاص بك:
الخطوة 1: القياس. قم بإحضار بيان أداة MCP الخاص بك وقم بتشغيله من خلال الرمز المميز عداد. إذا تجاوزت 15000 رمزًا، فسيؤتي وضع Code Mode ثماره. إذا كان عمرك أقل من 6000، تخطي بقية هذا المنصب.
الخطوة 2: كشف السطح المكتوب بجانب MCP. لديك بالفعل OpenAPI
المواصفات إذا قمت بتشغيل HTTP API. قم بإنشاء أنواع TypeScript منه (يقوم botoi's SDK بذلك؛ انظر
packages/sdk-typescript) واستضافة الناتج .d.ts الملف في أ
عنوان URL مستقر. تقوم أوقات تشغيل وضع Code بجلب هذا الملف مرة واحدة في كل جلسة واستخدامه كاستيراد
الهدف. تستمر نقطة نهاية MCP الخاصة بك في خدمة العملاء الكلاسيكيين دون تغيير.
الخطوة 3: الطريق من قبل العميل. يستمر Claude Desktop وCursor وVS Code في الضرب
/mcp واحصل على مخططات الأدوات الكلاسيكية. أطر عمل الوكيل (وكلاء Cloudflare،
Mastra، LangGraph) ضرب جديد /code-mode الطريق الذي يُرجع تعريف النوع و
مقبض وقت التشغيل. نفس الخادم، نفس منطق العمل، بروتوكولان.
يشحن Botoi كلا الشكلين اليوم. نقطة نهاية MCP الكلاسيكية عند api.botoi.com/mcp يقدم 49 أداة منسقة مع مخططات JSON كاملة لعملاء سطح المكتب. SDK المكتوب في api.botoi.com/docs يمنح أطر عمل الوكيل سطح استيراد ملف واحد. أغطية الطبقة المجانية (5 متطلبات/دقيقة، بدون مفتاح). الاستكشاف؛ طبقة المطورين (1000 طلب/يوم مع مفتاح مجاني) تغطي حلقات وكيل الإنتاج. إذا أكبر بند في مشروع القانون الأنثروبي هو أوصاف الأدوات، والتبديل يدفع لنفسه في الأسبوع الأول.
FAQ
- لماذا يؤدي حقن مخططات الأدوات إلى إهدار الرموز المميزة عندما قد يستدعي النموذج أداة واحدة فقط؟
- يقوم Classic MCP بشحن مخطط JSON الخاص بكل أداة إلى سياق النظام عند كل منعطف، وبالتالي يدفع النموذج التكلفة الكاملة سواء كان يستدعي أداة واحدة أو لا شيء. لا يمكن للنموذج أن يعرف الأدوات الموجودة إلا إذا أخبرتها بذلك، وأخبرتها بالمخططات. يستبدل وضع Code هذا البث بتعريف نوع واحد يستشيره وقت التشغيل فقط عندما يستورد الكود الذي تم إنشاؤه وظيفة بالفعل.
- هل يعمل وضع Code مع Claude Desktop أو Cursor اليوم؟
- ليس بعد. يتحدث كل من تكامل Claude Desktop وCursor وMCP الخاص بـ VS Code عن بروتوكول MCP الكلاسيكي، لذلك ما زالوا يتلقون مخططات الأدوات المضمنة. يستهدف وضع Code الخاص بـ Cloudflare أطر عمل الوكلاء (Cloudflare Agents وMastra وLangGraph) حيث يمكنك التحكم في وقت التشغيل ويمكنك تجميع مخرجات الوكيل قبل تشغيله.
- ماذا عن الأمان، أليس السماح للنموذج بكتابة التعليمات البرمجية أمرًا محفوفًا بالمخاطر؟
- وهذا هو السبب وراء تشغيل Code Mode للتعليمات البرمجية التي تم إنشاؤها داخل V8 المعزول دون الوصول إلى نظام الملفات، وعدم الوصول إلى الشبكة خارج سطح واجهة برمجة التطبيقات المكتوبة، وميزانية وحدة المعالجة المركزية. صندوق الحماية هو نفس الشكل الذي يستخدمه Cloudflare للعمال. لا يمكن للنموذج الهروب من العزلة أكثر مما يستطيع المستخدم الهروب من علامة تبويب المتصفح.
- هل يمكنني استخدام Classic MCP وCode Mode من نفس الخادم؟
- نعم، ويجب عليك ذلك. احتفظ بنقطة نهاية MCP الكلاسيكية لعملاء سطح المكتب والمحررين الذين يحتاجون إلى اكتشاف أداة التكوين الصفري. قم بإضافة سطح مكتوب (أنواع OpenAPI أو TypeScript) لأطر عمل الوكيل التي تقوم بتشغيل Code Mode. يقوم Botoi بهذا اليوم: تخدم نقطة نهاية MCP Claude Desktop، وتعمل مواصفات OpenAPI على تشغيل SDK التي تستوردها أطر عمل الوكيل كتعريف للنوع.
- كم سيوفر هذا فعليًا على الفاتورة الإنسانية؟
- بالنسبة لخادم مكون من 49 أداة بمعدل إدخال Opus الخاص بـ Anthropic، تبلغ تكلفة 29400 رمزًا مميزًا لكل دورة حوالي 0.44 دولارًا أمريكيًا لكل محادثة مكونة من 10 أدوار في الرموز المميزة لوصف الأداة وحدها. يقوم وضع Code بتقليص ذلك إلى تحميل من نوع 1K-token لمرة واحدة، مما يقلل تكلفة وصف كل محادثة إلى جزء من السنت. عند إجراء 10000 محادثة شهريًا، يبلغ الفرق حوالي 4400 دولار.
ابدأ البناء مع botoi
أكثر من 150 نقطة نهاية API للبحث ومعالجة النصوص وتوليد الصور وأدوات المطورين. باقة مجانية، بدون بطاقة ائتمان.