هل لاحظت فجأة أن Claude Code أصبح أقل ذكاءً؟ لم تكن وحيداً. في 23 أبريل 2026، نشرت Anthropic تقريراً شفافاً يفصّل ثلاثة أخطاء متزامنة أدت إلى تدهور جودة Claude Code لأسابيع. هذا المقال يحلل ما حدث فنياً، وكيف عالجته الشركة، والدروس التي يستفيد منها كل مطور يبني على نماذج اللغة الكبيرة.
—
جدول المحتويات
1. ما هو Claude Code ولماذا يهم المطورون؟
2. الخطأ الأول: تغيير مستوى التفكير الافتراضي
3. الخطأ الثاني: Bug في تنظيف ذاكرة الجلسات
4. الخطأ الثالث: تعليمة مختصرة في التعليمات النظامية
5. لماذا استغرق الأمر أسابيع لاكتشاف الأخطاء؟
6. كيف أصلحت Anthropic المشاكل
7. الدروس التقنية لمطوري AI
8. كيف تحمي مشروعك من أخطاء مشابهة
9. الأسئلة الشائعة
10. الخاتمة والمصادر
—
ما هو Claude Code ولماذا يهم المطورون؟
Claude Code هو وكيل برمجة يعمل في سطر الأوامر (CLI) من Anthropic. يختلف عن واجهة Claude Chat العادية: يقرأ ملفات مشروعك بالكامل، ينفذ أوامر shell، يكتب اختبارات، ويُجري Git commits — كل ذلك من داخل Terminal.
لماذا يهم:
| الميزة | الوصف |
|---|---|
| فهم السياق الكامل | يقرأ المئات من الملفات ويفهم علاقاتها |
| تنفيذ أوامر | يشغل npm test أو pytest أو أي أمر shell |
| التفكير الممتد (Extended Thinking) | يفكر لدقائق قبل الرد على المشاكل المعقدة |
| التكامل مع Git | يُنشئ branches ويُجري commits ويفتح PRs |
الفكرة الجوهرية: بدل أن تنسخ/تلصق كود إلى ChatGPT، Claude Code يعيش داخل مشروعك. يشبه Hermes Agent لكنه موجه للمطورين التقنيين.
—
الخطأ الأول: تغيير مستوى التفكير الافتراضي (4 مارس)
ما حدث؟
عند إطلاق Opus 4.6 في فبراير 2026، كان Claude Code يعمل افتراضياً على وضع “تفكير عالي” (High reasoning effort). المشكلة: بعض المستخدمين شعروا أن واجهة المستخدم تتجمد لدقائق.
في 4 مارس، غيّرت Anthropic الإعداد الافتراضي إلى “تفكير متوسط” (Medium effort) لحل مشكلة التأخير.
لماذا كان هذا خطأً؟
“كلما فكر النموذج أكثر، كانت النتيجة أفضل.” هذا ما أكدته Anthropic في تقريرها. التفكير المتوسط أسرع، لكنه أقل ذكاءً. المستخدمون بدأوا يشكون من أن Claude Code “أصبح أغبى”.
المؤشرات الفنية:
– وضع “متوسط” يقلل الاستهلاك من الحدود (usage limits)
– لكنه يفشل في المهام المعقدة التي يحتاجها المطورون
– التغيير طبّق على Opus 4.6 فقط في البداية
التصحيح:
في 7 أبريل، عادت Anthropic للإعداد القديم. الآن:
– Opus 4.7: تفكير عالي افتراضياً
– النماذج الأخرى (Sonnet/Haiku): تفكير عالي افتراضياً
المستخدم يمكنه اختيار “تفكير منخفض” للمهام البسيطة، لكن الذكاء لا يُضحى به.
—
الخطأ الثاني: Bug في تنظيف ذاكرة الجلسات (26 مارس)
ما حدث؟
Claude Code يستخدم Prompt Caching لتخزين سياق المحادثة. هذا يقلل التكلفة والتأخير. عندما يفكر Claude خلال مهمة، يحتفظ بـ “تفكيره” في المحادثة ليفهم في المرة القادمة لماذا اتخذ قراراً معيناً.
في 26 مارس، أضافت Anthropic ميزة: إذا كانت الجلسة خاملة لأكثر من ساعة، يُحذف “التفكير القديم” لتقليل التكلفة عند العودة.
الـ Bug الفني:
المنطق كان بسيطاً:
إذا (الجلسة خاملة > ساعة):
احذف التفكير القديم (مرة واحدة)
لكن الـ Bug جعله:
إذا (الجلسة خاملة > ساعة مرة واحدة):
احذف التفكير القديم (في كل turn من الآن)
بمجرد أن تتجاوز الجلسة الحد الزمني مرة واحدة، كل طلب جديد يُحذف تفكيره السابق — ويُفقد السياق، ويُصدر Cache Miss، ويستهلك tokens إضافية.
الآثار:
1. فقدان السياق: Claude ينسى لماذا أجرى تعديلات سابقة
2. استنزاف الحدود: Cache Miss يعني استهلاك tokens أكثر
3. عدم التكرار: كل turn يبدأ من الصفر تقريباً
التصحيح:
أُصلح في 10 أبريل (v2.1.101). الآن يُحذف التفكير القديم مرة واحدة فقط عند العودة.
الدرس المهم:
> “الـ Bug كان عند تقاطع إدارة السياق في Claude Code، API Anthropic، والتفكير الممتد. مر بمراجعات بشرية وأوتوماتيكية متعددة — لكن الاختبارات لم تُصمم لهذا السيناريو.”
—
الخطأ الثالث: تعليمة مختصرة في التعليمات النظامية (16 أبريل)
ما حدث؟
Claude Opus 4.7 (الإصدار الجديد) يميل للإسهاب. هذا مفيد للمشاكل المعقدة، لكنه يستهلك tokens أكثر.
استعداداً للإصدار، أضافت Anthropic تعليمة في System Prompt:
> “قيود الطول: احتفظ بالنص بين استدعاءات الأدوات بـ 25 كلمة أو أقل. احتفظ بالردود النهائية بـ 100 كلمة إلا إذا تطلب المهام المزيد من التفاصيل.”
لماذا فشلت؟
التعليمة بحد ذاتها تبدو منطقية — لكنها تتعارض مع طبيعة البرمجة. عند كتابة كود، لا يمكنك الاختصار إلى 25 كلمة بين كل استدعاء أداة. النتيجة: Claude أصبح يتجاهل السياق البرمجي ويُقدم ردوداً سطحية.
متى أُكتشف؟
بعد إطلاق Opus 4.7 في 16 أبريل، بدأ المستخدمون بالشكوى من “جودة برمجة أسوأ”. Anthropic شغلت Ablations (اختبارات بإزالة أسطر من التعليمات) واكتشفت أن تعليمة “25 كلمة” تُسبب انحداراً في جودة الكود.
التصحيح:
أُلغيت التعليمة في 20 أبريل (v2.1.116).
—
لماذا استغرق الأمر أسابيع لاكتشاف الأخطاء؟
هذا أهم سؤال في التقرير. ثلاثة أخطاء متزامنة — كل واحد يؤثر على شريحة مختلفة من المستخدمين في توقيت مختلف. النتيجة: ظاهرة التدهور تبدو “عشوائية” و”واسعة”.
الجدول الزمني:
| التاريخ | التغيير | النموذج المتأثر |
|---|---|---|
| 4 مارس | تغيير effort الافتراضي → Medium | Opus 4.6 |
| 26 مارس | Bug تنظيف الذاكرة | Sonnet 4.6, Opus 4.6 |
| 7 أبريل | العودة إلى effort High | Opus 4.6 |
| 10 أبريل | إصلاح Bug الذاكرة | Sonnet 4.6, Opus 4.6 |
| 16 أبريل | تعليمة الاختصار + Opus 4.7 | Opus 4.7 |
| 20 أبريل | إلغاء تعليمة الاختصار | Opus 4.7 |
لماذا كان التشخيص صعباً؟
1. تجارب داخلية متقاطعة: Anthropic كانت تشغّل تجربة server-side على message queuing — هذا أربك إعادة الإنتاج (reproduction)
2. توقيت مختلف لكل Bug: كل خطأ بدأ في تاريخ مختلف وانتهى في تاريخ مختلف
3. تقييمات غير كافية: الاختبارات الداخلية لم تُغطِّ الأثر المشترك للتغييرات
—
كيف أصلحت Anthropic المشاكل
1. إصلاحات فورية:
– إعادة effort الافتراضي → High (7 أبريل)
– إصلاح Bug الذاكرة (10 أبريل)
– إلغاء تعليمة الاختصار (20 أبريل)
2. تعويض المستخدمين:
– إعادة تعيين حدود الاستخدام (usage limits) لجميع المشتركين
– شفافية كاملة عبر التقرير العلني
3. إجراءات وقائية جديدة:
| الإجراء | التفاصيل |
|---|---|
| Build واحد للجميع | موظفو Anthropic سيستخدمون نفس النسخة العامة التي يستخدمها العملاء |
| أداة Eval المحسّنة | شحن أداة تقييم داخلية محسّنة للعملاء |
| ضوابط أشد على System Prompt | اختبار suite شامل لكل تغيير في التعليمات النظامية |
| Ablations إجبارية | اختبار بإزالة كل سطر من التعليمات قبل الشحن |
4. قنوات تواصل جديدة:
– إنشاء حساب @ClaudeDevs على X (Twitter)
—
الدروس التقنية لمطوري AI
الدرس 1: التفكير = الجودة
لا تضحِّ بالتفكير العميق (reasoning) لصالح السرعة في الأدوات البرمجية. المستخدمون يفضلون انتظار دقيقتين إضافيتين على حل خاطئ.
الدرس 2: State Management هو الخصم الأول
Bug الذاكرة لم يكن في النموذج — كان في إدارة الحالة (state management) بين الـ client والـ API. 90% من مشاكل أنظمة AI تأتي من إدارة السياق، ليس من النموذج نفسه.
الدرس 3: System Prompt = API Surface
كل تغيير في System Prompt هو تغيير API. يجب اختباره مثل أي تغيير API: اختبارات انحدار (regression tests)، ablations، ومراقبة.
الدرس 4: Prompt Caching ليست مجرّد “تحسين أداء”
Prompt Caching تؤثر على سلوك النموذج (لأنها تحدد ما يُحتفظ به في السياق). أي تغيير في منطق Caching يجب اختباره للأثر السلوكي، ليس فقط الأثر المالي.
الدرس 5: الشفافية تفوز
Anthropic لم تنتظر حتى تنتهي الأزمة بصمت. نشرت تقريراً تقنياً مفصلاً — هذا بنى الثقة أكثر مما كان يبني الصمت.
الدرس 6: اختبر مع المستخدمين الحقيقيين
التقييمات الداخلية (evals) لم تُكتشف Bug الذاكرة. اكتشفه المستخدمون عندما لاحظوا استنزافاً غير طبيعي في حدود الاستخدام. لا شيء يختبر البرنامج مثل المستخدم الحقيقي.
—
claude --usage أو عبر Dashboard. ارتفاع مفاجئ يمكن أن يكون إشارة مبكرة لمشكلة caching.
—
كيف تحمي مشروعك من أخطاء مشابهة
إذا كنت تبني على LLM:
| الممارسة | التنفيذ |
|---|---|
| اختبار System Prompt | استخدم Ablations — أزل كل تعليمة واختبر النتيجة |
| مراقبة Caching | راقب hit/miss rate — ارتفاع Miss قد يعني Bug سلوكي |
| تسجيل Context | احتفظ بسجل من ما يُرسل للنموذج في كل طلب |
| versioning للPrompts | عالج System Prompt مثل أي كود — versions ومراجعات |
| الاختبار المستمر | استخدم مجموعة fixed test suite قبل كل تغيير |
أدوات مفيدة:
– MCP (Model Context Protocol): لتوحيد إدارة السياق بين أدواتك
– OpenClaw: لبناء وكلاء مخصصين مع تحكم في System Prompt
– Hermes Agent: الوكيل الذكي الذي يتعلم من تجاربه
—
الأسئلة الشائعة
هل Claude Code آمن للاستخدام الآن؟
نعم. جميع الأخطاء الثلاثة أُصلحت اعتباراً من 20 أبريل 2026 (v2.1.116). Anthropic أعادت تعيين حدود الاستخدام ونشرت شفافية كاملة.
هل هذا يعني أن Anthropic “ت degrades” النماذج عمداً؟
لا. التقرير يؤكد بوضوح: “لم ن degrade النماذج عمداً أبداً”. API وطبقة الاستدلال (inference) لم تتأثر — الأخطاء كانت في طبقة المنتج (product layer).
هل يؤثر هذا على Claude Chat العادي؟
الأخطاء الثلاثة كانت خاصة بـ Claude Code (أداة CLI). Claude Chat لم يتأثر مباشرة — لكن بعض المستخدمين ربما لاحظوا تغييرات إذا كانوا يستخدمون API مباشرة.
ما الفرق بين Opus 4.6 و Opus 4.7؟
Opus 4.7 أحدث. يميل للإسهاب أكثر (وهذا يجعله أذكى في المشاكل المعقدة). التغييرات في هذا التقرير تتعلق بطبقة المنتج (Claude Code)، ليس بالنموذج نفسه.
—
الخاتمة والمصادر
تقرير Anthropic في 23 أبريل 2026 هو نموذج للشفافية التقنية. بدلاً من إنكار المشكلة أو إلقاء اللوم على “نموذج يتطور”، فصّلت الشركة ثلاثة أخطاء محددة، شرحت آلية كل Bug، وحدّدت إجراءات وقائية محددة.
للمطورين العرب الذين يبنون على LLM، الدرس الأهم: طبقة المنتج ( caching + system prompt + state management ) هي التي تقتل الجودة — ليس النموذج نفسه. ركّز اختباراتك على هذه الطبقة.
المصادر:
1. التقرير الرسمي — Anthropic Engineering Blog (أبريل 2026)
2. Claude Code — المنتج الرسمي
3. OpenClaw: تخصيص الوكلاء الذكية
4. MCP: بروتوكول السياق الموحد
5. Hermes Agent: الوكيل الذكي الذي يتعلم من تجاربه
6. أنظمة الوكلاء المتعددين 2026: الدليل الشامل

اترك تعليقاً