Agent Battle: Mine the most diamonds in 45 minutes

⏱️ مدة القراءة: 1 دقيقة

ستجد في هذا المقال شرحًا مباشرًا وخطوات عملية مختصرة تساعدك على التطبيق بسرعة.

معركة وكلاء AI في Minecraft: كيف تبني وكيلاً ذكياً ينقب عن الماس في 45 دقيقة؟

✍️ بقلم: علي الرزق | 📅 10 يونيو 2026

📋 فهرس المحتويات

تخيل أنك في سباق مع 50 مبرمجاً آخر، كل واحد منهم يبني وكيل ذكاء اصطناعي (AI Agent) خاص به، والمهمة: استخراج أكبر عدد ممكن من الماس في لعبة Minecraft خلال 45 دقيقة فقط. الفائز ليس من يستخرج أكبر كمية ماس، بل من يحقق أفضل توازن بين كمية الماس وعدد الرموز (Tokens) التي يستهلكها وكيله.

هذه هي فكرة “Agent Battle” — معركة الوكلاء — التي نظمها فريق Anthropic (أنثروبيك) المطور لـ Claude. في هذه الورشة، تعلم المشاركون كيفية بناء ونشر وكيل مُدار (Managed Agent) قادر على اللعب في Minecraft بشكل مستقل، ثم تحسين أدائه خطوة بخطوة. في هذا المقال، سنشرح لك كل ما حدث في هذه الورشة بطريقة مبسطة، وكيف يمكنك أنت أيضاً بناء وكيل ذكي خاص بك.

1. ما هو الوكيل المُدار (Managed Agent)؟

قبل أن ندخل في التفاصيل، لنفهم أولاً ما هو “الوكيل المُدار”. تخيل أن لديك مساعداً شخصياً ذكياً — لكن بدلاً من أن يكون إنساناً، فهو برنامج كمبيوتر يمكنه التفكير واتخاذ القرارات بنفسه. الوكيل المُدار (Managed Agent) هو وكيل ذكاء اصطناعي تستضيفه شركة أنثروبيك على خوادمها (سيرفراتها)، وتقوم هي بمعظم أعمال الإعداد والتهيئة نيابة عنك. أنت فقط تحتاج إلى ضبط بعض الإعدادات ليؤدي الوكيل المهمة التي تريدها بالطريقة التي تناسبك.

شريحة تعريف الوكيل المُدار من Anthropic

في هذه الورشة، قام فريق Anthropic بإعداد البنية التحتية (Infrastructure) بالكامل — الخوادم، قواعد البيانات، والاتصال بلعبة Minecraft. كل ما كان على المشاركين فعله هو تعديل ملف بسيط اسمه my_agent.py لتحديد سلوك وكيلهم. هذا يشبه شراء سيارة جاهزة بدلاً من بناء واحدة من الصفر — أنت فقط تضبط المقود والمقاعد لتناسبك.

2. قواعد المعركة: كيف تعمل المسابقة؟

المعركة لها قواعد بسيطة لكنها ذكية. إليك التفاصيل:

  • الوقت: 35 دقيقة لبناء وتجربة وكيلك، ثم 5 دقائق لكل “جولة تنقيب” (Run) يقوم بها الوكيل في Minecraft.
  • جولة واحدة فقط: يمكنك تقديم جولات متعددة، لكن النظام يحسب فقط أفضل جولة لك.
  • الإيقاف المبكر: يمكنك إيقاف الجولة في أي وقت بالضغط على Ctrl+C في الطرفية (Terminal) — مثل إطفاء التلفاز عندما تمل من البرنامج.
  • التقييم السريع: هناك مجموعة تقييم (Eval Set) جاهزة تستغرق دقيقة واحدة فقط، مما يسمح لك بتجربة تعديلاتك بسرعة.
  • لوحة المتصدرين (Leaderboard): لوحة حية تظهر ترتيب المشاركين في الوقت الفعلي.
  • دردشة الوكلاء: ميزة فريدة — وكلاء المشاركين يمكنهم التحدث مع بعضهم البعض!

شريحة شرح قواعد معركة الوكلاء

في حال التعادل (Tie)، يتم الفصل بناءً على كفاءة الرموز (Token Efficiency) — أي من استخدم موارد أقل لتحقيق نفس النتيجة. وهذا درس مهم: في عالم الذكاء الاصطناعي، الكفاءة أهم من القوة الخام.

3. الأدوات التي ستستخدمها لبناء الوكيل

لن تحتاج إلى بناء كل شيء من الصفر. فريق Anthropic زوّد المشاركين بمجموعة أدوات جاهزة:

🧰 ملف my_agent.py

هذا هو الملف الرئيسي الذي ستعدل فيه كل شيء. يمكنك تغيير:

  • النموذج (Model): أي نموذج ذكاء اصطناعي سيستخدمه وكيلك (مثل Claude Opus أو Sonnet).
  • النظام الموجّه (System Prompt): التعليمات الأساسية التي تحدد سلوك الوكيل — مثل دستور يتبعه.
  • المهارات (Skills): قدرات إضافية يمكنك إضافتها للوكيل، مثل مهارة “التنقيب الذكي” التي زودتها Anthropic.

شريحة شرح ملف my_agent.py ومكوناته

🔌 خادم MCP (MCP Server)

MCP اختصار لـ Model Context Protocol (بروتوكول سياق النموذج) — وهي طريقة موحدة تسمح للوكيل بالتواصل مع أدوات خارجية. في هذه الحالة، الـ MCP Server يربط الوكيل بنسخة معدلة من Minecraft تسمى Mind Flare (مايند فلير). بدلاً من النظر إلى الشاشة، يستخدم الوكيل أدوات MCP مثل:

  • Mind Block: لمعرفة نوع الكتلة التي أمامه (تراب، حجر، ماس…).
  • Jump: للقفز فوق العوائق.
  • Go Near: للتحرك نحو موقع معين.

تخيل أن الوكيل أعمى — لا يرى الشاشة — لكنه يلمس كل شيء بيديه ليفهم ما حوله. هذه هي فكرة MCP: الوكيل “يشعر” بالعالم من خلال أدوات بدلاً من الرؤية.

4. كيف تضبط إعدادات الوكيل (Agent Configuration)؟

إعدادات الوكيل هي المفتاح لنجاحه. هناك ثلاثة عناصر رئيسية يمكنك تعديلها:

📝 النظام الموجّه (System Prompt)

هذا هو النص الذي يحدد شخصية الوكيل وسلوكه. في بداية الورشة، كان النظام الموجّه فارغاً — مثل روبوت بدون تعليمات. مهمتك هي كتابة تعليمات واضحة تجعل الوكيل ينقب بذكاء. مثلاً:

  • “ابحث أولاً عن الكهوف لأن الماس يظهر فيها بكثرة.”
  • “لا تهدر الوقت في حفر عشوائي — اتبع استراتيجية منظمة.”
  • “إذا وجدت الماس، استخرجه فوراً وعد إلى القاعدة.”

شريحة شرح إعدادات الوكيل

🎯 المهارات (Skills)

المهارات هي قطع معرفية جاهزة يمكنك إضافتها للوكيل. فريق Anthropic زوّد المشاركين بمهارة “Cloud Code Skill” التي تساعد في إعداد البيئة. يمكنك أيضاً كتابة مهاراتك الخاصة — مثل مهارة “التنقيب الفعال” التي تعلّم الوكيل أفضل طرق العثور على الماس.

🔧 أدوات MCP المخصصة

يمكنك أيضاً إنشاء أدوات MCP خاصة بك إذا أردت إضافة قدرات جديدة للوكيل. مثلاً، يمكنك إنشاء أداة “تحليل التضاريس” التي تساعد الوكيل على فهم التضاريس (Terrain) بشكل أفضل.

شريحة توضح أدوات MCP والمهارات

5. التسلق على التلال (Hill Climbing): سر تحسين الوكلاء

“التسلق على التلال” (Hill Climbing) هو أسلوب يستخدمه فريق Anthropic داخلياً لتحسين وكلائهم. الفكرة بسيطة: بدلاً من محاولة بناء الوكيل المثالي من أول مرة، تبدأ بنسخة بسيطة ثم تحسّنها خطوة بخطوة.

تخيل أنك على جبل مغطى بالضباب — لا ترى القمة. كل ما يمكنك فعله هو اتخاذ خطوة صغيرة في اتجاه يبدو أنه يصعد. إذا شعرت أنك ترتفع، تستمر. إذا شعرت أنك تنخفض، تعود وتجرب اتجاهاً آخر. هذا هو التسلق على التلال — تحسين تدريجي مبني على التجربة والقياس.

شريحة شرح مفهوم Hill Climbing

الخطوات العملية للتسلق على التلال:

  1. قس (Measure): اختبر وكيلك الحالي وسجل أداءه — كم ماس استخرج؟ كم رمز (Token) استهلك؟
  2. افهم (Understand): حلّل سلوك الوكيل — لماذا نجح؟ لماذا فشل؟ هل كان بطيئاً في اتخاذ القرارات؟
  3. حسّن (Improve): غيّر شيئاً واحداً — مثلاً، عدّل النظام الموجّه (System Prompt) أو جرّب نموذجاً مختلفاً.
  4. كرّر (Iterate): اختبر مجدداً وقارن النتائج. إذا تحسّن الأداء، استمر في هذا الاتجاه. إذا تراجع، ارجع إلى الإعداد السابق.

شريحة توضح دورة التحسين التكراري

هذه الدورة — قياس → فهم → تحسين → تكرار — هي نفسها التي تستخدمها شركات كبرى مثل Anthropic و Google لتحسين نماذجها. الفرق الوحيد هو أنهم يطبقونها على نطاق أوسع بكثير.

6. كفاءة الرموز (Token Efficiency): لماذا هي أهم من عدد الماسات؟

في عالم الذكاء الاصطناعي، كل كلمة يقرأها أو يكتبها الوكيل تسمى “رمزاً” (Token). تخيل أن كل رمز هو قطعة نقود تدفعها مقابل كل فكرة يفكر فيها الوكيل. إذا كان وكيلك يستهلك 100,000 رمز لاستخراج 10 ماسات، فهذا غير فعال. أما إذا استهلك 10,000 رمز فقط لنفس النتيجة، فهذا ممتاز.

شريحة توضح مفهوم Token Efficiency

لهذا السبب، قالت القواعد: “الفائز ليس من يستخرج أكبر عدد من الماسات، بل من يحقق أفضل نسبة ماس إلى رموز (Diamonds-to-Tokens Ratio).” هذا يعني أنك تحتاج إلى وكيل ذكي لا يهدر الموارد — مثل موظف يعمل بذكاء وليس بجهد فقط.

كيف تحقق كفاءة أفضل في الرموز؟

  • نظام موجّه مختصر: لا تكتب تعليمات طويلة غير ضرورية. كل كلمة زائدة تستهلك رموزاً.
  • نموذج أخف: أحياناً، نموذج أصغر (مثل Claude Sonnet بدلاً من Opus) يؤدي المهمة بكفاءة أعلى.
  • تجنب التكرار: لا تجعل الوكيل يتحقق من نفس الشيء مراراً وتكراراً.

شريحة توضح استراتيجيات تحسين كفاءة الرموز

7. نتائج المعركة: من فاز؟

في نهاية الـ 35 دقيقة، كانت النتائج مثيرة. الرقم القياسي كان 19 ماسة — وهو إنجاز مذهل في 5 دقائق فقط! لكن الأكثر إثارة كان وجود تعادل ثلاثي (Three-Way Tie) بين ثلاثة مشاركين، كلهم استخرجوا نفس العدد من الماسات. تم الفصل بناءً على كفاءة الرموز (Token Efficiency)، حيث كان الفائز من استخدم أقل عدد من الرموز لتحقيق نفس النتيجة.

شريحة نتائج المعركة ولوحة المتصدرين

أحد المشاركين استطاع كسر حاجز 19 ماسة في دقيقة و20 ثانية فقط — مما أثار دهشة الجميع ودفعهم لمطالبته بالكشف عن تقنيته!

🎯 الخلاصة

ما تعلمناه من هذه المعركة يتجاوز مجرد التنقيب عن الماس في لعبة فيديو. إنه درس في كيفية بناء وكلاء ذكاء اصطناعي فعالين:

  • ✅ ابدأ بسيطاً ثم حسّن تدريجياً (Hill Climbing).
  • ✅ ركّز على الكفاءة، ليس فقط على النتائج الخام.
  • ✅ استخدم الأدوات الجاهزة (MCP, Skills) بدلاً من إعادة اختراع العجلة.
  • ✅ قس أداء وكيلك باستمرار واتخذ القرارات بناءً على البيانات.

هذه المبادئ تنطبق على أي وكيل AI تبني — سواء كان لخدمة العملاء، تحليل البيانات، أو حتى لعب Minecraft!

📖 اقرأ أيضاً: تعليم الوكلاء التعلم من فريقك

❓ الأسئلة الشائعة (FAQ)

س: هل أحتاج إلى معرفة برمجية لبناء وكيل AI؟

ج: نعم، تحتاج إلى معرفة أساسية بلغة Python (بايثون). لكنك لا تحتاج إلى خبرة عميقة — الملف الرئيسي (my_agent.py) بسيط ويمكن تعديله بسهولة. إذا كنت تعرف كيف تكتب دالة (Function) بسيطة، فأنت مؤهل للبدء.

س: ما الفرق بين الوكيل المُدار (Managed Agent) والوكيل العادي؟

ج: الوكيل المُدار تستضيفه الشركة المطورة (مثل Anthropic) على خوادمها، وتتولى مسؤولية البنية التحتية (Infrastructure) والصيانة. أنت فقط تركز على ضبط سلوك الوكيل. أما الوكيل العادي، فأنت مسؤول عن كل شيء — من الخادم إلى قاعدة البيانات.

س: ما هو MCP (Model Context Protocol)؟

ج: MCP هو بروتوكول (Protocol) — مجموعة قواعد — تسمح للوكيل بالتواصل مع أدوات خارجية. تخيل أن الوكيل إنسان لا يرى، و MCP هي يداه التي تلمس بها الأشياء لتفهم ما حوله. كل أداة MCP تعطي الوكيل قدرة جديدة، مثل معرفة نوع الكتلة التي أمامه أو القفز فوق عائق.

س: لماذا كفاءة الرموز (Token Efficiency) مهمة؟

ج: لأن كل رمز (Token) يكلف مالاً ووقتاً. إذا كان وكيلك يستهلك 100,000 رمز لمهمة بسيطة، فهذا مكلف وغير فعال. تحسين كفاءة الرموز يعني أن وكيلك يعمل بذكاء — ينجز المهمة بأقل موارد ممكنة. هذا يشبه سيارة تستهلك وقوداً أقل لقطع نفس المسافة.

س: هل يمكنني تجربة هذا بنفسي؟

ج: نعم! يمكنك البدء بقراءة دليل بناء وكيل SRE باستخدام Claude Managed Agents على موقعنا. كما يمكنك متابعة الفيديو الأصلي للورشة على YouTube لمشاهدة الشرح الكامل.

تم كتابة هذا المقال بواسطة علي الرزق — كاتب متخصص في تبسيط تقنيات الذكاء الاصطناعي للقارئ العربي العام.