أبرز إطلاقات نماذج الذكاء الاصطناعي – مارس 2026: GPT-5.4 وQwen3.5 وClaude Code Security

جدول المحتويات

مقدمة
GPT-5.4: النموذج الأشمل من OpenAI
Codex على Windows: البرمجة في كل مكان
أمان GPT-5.4: قدرات عالية وحماية أعلى
Claude Code Security: الكشف عن الثغرات بذكاء
سلسلة Qwen3.5: النماذج المفتوحة الخفيفة من Alibaba
مقارنة شاملة بين النماذج
الخلاصة

مقدمة

شهد مطلع مارس 2026 موجة من الإطلاقات المتزامنة في عالم الذكاء الاصطناعي، إذ كسرت كلٌّ من OpenAI وAnthropic وAlibaba حواجز جديدة في القدرات والأمان والكفاءة. في هذا التقرير نستعرض بتفصيل دقيق ومعلومات حديثة ومباشرة من المصادر الرسمية أبرز ما أُعلن عنه خلال الأسبوع الأول من مارس 2026.

GPT-5.4: النموذج الأشمل من OpenAI

في الخامس من مارس 2026، أطلقت OpenAI رسمياً نموذج GPT-5.4 عبر ChatGPT (تحت اسم GPT-5.4 Thinking) وعبر API وأداة Codex. وصفت الشركة هذا النموذج بأنه (وللاطلاع على تطور النماذج، راجع مقالنا عن أبرز تحديثات نماذج الذكاء الاصطناعي) “أكثر نماذجها قدرةً وكفاءةً للعمل المهني حتى الآن”.

ما الذي يميز GPT-5.4؟

يجمع GPT-5.4 بين قدرات البرمجة المتقدمة التي جاءت مع GPT-5.3-Codex وتحسينات جوهرية في:

استخدام الحاسوب (Computer Use): هو أول نموذج متعدد الأغراض من OpenAI يمتلك قدرات computer-use مدمجة، مما يتيح له التحكم في الحواسيب وتنفيذ مهام معقدة عبر التطبيقات المختلفة. حقق 75.0% في اختبار OSWorld-Verified، متجاوزاً أداء الإنسان البالغ 72.4%.
نافذة سياق بمليون رمز (1M Context): يدعم GPT-5.4 نافذة سياق تصل إلى مليون رمز (Token) مما يجعله قادراً على التخطيط وتنفيذ مهام طويلة الأمد بدون انقطاع.
الكفاءة في استخدام الرموز: يستهلك GPT-5.4 عدداً أقل بكثير من الرموز مقارنة بـ GPT-5.2 لحل المسائل ذاتها، مما يُخفّض التكاليف ويرفع السرعة.
Tool Search: قدرة جديدة تساعد الوكلاء (Agents) على العثور على الأدوات المناسبة واستخدامها بكفاءة ضمن بيئات أدوات ضخمة.
دقة أعلى وهلوسة أقل: على مجموعة من المطالبات التي أبلغ المستخدمون عن أخطاء فيها، كانت الادعاءات الفردية لـ GPT-5.4 أقل احتمالاً للخطأ بنسبة 33% مقارنة بـ GPT-5.2، والردود الكاملة أقل احتمالاً لاحتواء أي خطأ بنسبة 18%.

الأداء المهني: أرقام قياسية

على اختبار GDPval الذي يقيس أداء الوكلاء في العمل المهني عبر 44 مهنة (من المحاسبة إلى الهندسة والقانون)، حقق GPT-5.4 نتيجة 83.0% في المقارنة مع المحترفين البشريين، مقابل 70.9% فقط لـ GPT-5.2. بل إن GPT-5.4 Pro حقق 82.0% في نفس الاختبار.

في مجال جداول البيانات، على اختبار داخلي يحاكي مهام محلل استثمارات مصرفي مبتدئ، حصل GPT-5.4 على 87.3% مقابل 68.4% لـ GPT-5.2. أما في تقييم العروض التقديمية، فقد فضّل المقيّمون البشريون نتائج GPT-5.4 في 68% من الحالات نظراً لجودتها الجمالية والبصرية الأعلى.

GPT-5.4 Thinking: التفكير الشفاف

في ChatGPT، يقدم GPT-5.4 Thinking “خطة تفكير مسبقة” للاستفسارات المعقدة، مما يتيح للمستخدم تعديل التوجيه أثناء تنفيذ الاستجابة دون الحاجة إلى البدء من جديد. هذا يعني نتائج أكثر توافقاً مع احتياجات المستخدم بدون جولات إضافية من المحادثة.

المقياس	GPT-5.4	GPT-5.3-Codex	GPT-5.2
GDPval (فوز أو تعادل)	83.0%	70.9%	70.9%
SWE-Bench Pro (عام)	57.7%	56.8%	55.6%
OSWorld-Verified	75.0%	74.0%	47.3%
Toolathlon	54.6%	51.9%	46.3%
BrowseComp	82.7%	77.3%	65.8%

Codex على Windows: البرمجة في كل مكان

إلى جانب إطلاق GPT-5.4، أعلنت OpenAI عن توفر تطبيق Codex على نظام Windows لمستخدمي ChatGPT Enterprise وEdu، وذلك بعد نحو شهر من إطلاقه على macOS.

ما الجديد في Codex؟

تطبيق Windows مدمج: يمكن تحميله مباشرة من موقع OpenAI، ويعمل بحساب موحد عبر التطبيق والـ CLI وإضافة IDE والسحابة.
/fast mode: يوفر سرعة تنفيذ أعلى بـ1.5x مع نفس النموذج وذكاء مطابق. يتيح للمطورين التنقل بين مهام البرمجة والتكرار والتصحيح بسرعة أكبر.
Codex CLI محسّن: واجهة مجددة، أوامر جديدة، وإصلاح للأخطاء.
مراجعة الكود في GitHub: إمكانية تهيئة Codex لمراجعة طلبات السحب (Pull Requests) الجديدة تلقائياً أو استدعائه بـ @codex.
Playwright (Interactive): مهارة تجريبية جديدة تتيح لـ Codex التصحيح البصري لتطبيقات الويب وElectron، بما فيها اختبار التطبيق أثناء بنائه.

يدعم Codex الآن GPT-5.4 كنموذج أساسي. ومن المقارنات البارزة في هذا المجال، اطلع على AWS Kiro بيئة التطوير الوكيلية، مما يعني الاستفادة من قدرات computer-use المتقدمة ونافذة السياق الواسعة مباشرةً من بيئة التطوير.

أمان GPT-5.4: قدرات عالية وحماية أعلى

صنّفت OpenAI GPT-5.4 كنموذج ذو قدرة سيبرانية عالية (High Cyber Capability) في إطار Preparedness Framework الخاص بها، وهو أول نموذج متعدد الأغراض يحصل على هذا التصنيف. ولفهم كيف توجّه هذه النماذج، راجع دليلنا عن هندسة البرومبت المتقدمة 2026 ويُنشر مع حزمة الحماية المقابلة.

حزمة الأمان السيبراني

مكدس الأمان السيبراني الموسّع (Expanded Cyber Safety Stack): أنظمة مراقبة لرصد الاستخدامات المشبوهة في الوقت الفعلي.
ضوابط وصول موثوقة (Trusted Access Controls): للتحكم الدقيق في من يمكنه الوصول إلى قدرات النموذج الأكثر حساسية.
الحجب غير المتزامن (Asynchronous Blocking): للطلبات عالية المخاطر على الأسطح التي تعمل بـ Zero Data Retention (ZDR)، مما يمنع إساءة استخدام القدرات الأمنية الحساسة.
بطاقة نظام شاملة (System Card): وثّقت OpenAI نهجها الكامل في التشغيل الآمن في بطاقة نظام منفصلة متاحة للعموم.

يُعدّ هذا النهج استجابةً مباشرة لمخاوف مجتمع الأمن من استغلال النماذج القوية في هجمات سيبرانية متطورة، مع الحفاظ على الفائدة للاستخدامات المشروعة.

Claude Code Security: الكشف عن الثغرات بذكاء

أطلقت Anthropic Claude Code Security، وهو حل أمني جديد يعمل بطريقة مختلفة جوهرياً عن الأدوات التقليدية لفحص الأكواد.

كيف يعمل؟

بدلاً من مطابقة الأنماط المعروفة (Pattern Matching) كما تفعل معظم أدوات الفحص، يعمل Claude Code Security مثل باحث أمني بشري:

فهم السياق الكامل: يقرأ تاريخ Git، يتتبع تدفق البيانات عبر الملفات المتعددة، ويفهم منطق العمل الخاص بالكود.
الكشف الموازي (Parallel Scan): يفحص قاعدة الكود بالكامل بالتوازي، ويحدد أنماط الثغرات المعقدة متعددة المكونات.
التحقق المعاكس (Adversarial Verification): كل نتيجة تمر بعملية تحقق ذاتية حيث “يتحدى” Claude نتائجه الخاصة قبل رفعها، مما يُقلل النتائج الإيجابية الكاذبة (False Positives) ويوفر وقت الفرق الأمنية. ولمن يريد تطبيق الأمان في سياق وكلاء الذكاء الاصطناعي للأعمال، فالتكامل ممكن.
اقتراح التصحيحات: لكل ثغرة مكتشفة، يقترح Claude تصحيحاً مع شرح للثغرة وأهميتها وطريقة الإصلاح.

أنواع الثغرات المكتشفة

يركز Claude Code Security على الثغرات عالية الخطورة التي تصعب على الأدوات التقليدية اكتشافها:

فساد الذاكرة (Memory Corruption)
ثغرات الحقن (Injection Flaws)
تجاوز المصادقة (Authentication Bypasses)
أخطاء المنطق المعقدة (Complex Logic Errors)

التوفر والوصول

Claude Code Security متاح حالياً في معاينة بحثية محدودة (Limited Research Preview) لعملاء Claude Enterprise وClaude Team عبر Claude Code على الويب. يمكن للمهتمين الانضمام إلى قائمة الانتظار عبر الموقع الرسمي.

سلسلة Qwen3.5: النماذج المفتوحة الخفيفة من Alibaba

في خضم سيطرة النماذج الكبيرة والمدفوعة، أطلقت شركة Alibaba عبر فريق Qwen سلسلة Qwen3.5 التي تتضمن نماذج خفيفة ومتوسطة وضخمة مفتوحة المصدر، أعادت رسم خريطة المنافسة في فئة النماذج المحلية.

السلسلة الصغيرة (Small Model Series) – مارس 2026

في الأول من مارس 2026، أطلق فريق Qwen السلسلة الصغيرة التي تضم:

Qwen3.5-0.8B: نموذج بالغ الصغر للأجهزة المحدودة للغاية.
Qwen3.5-2B: يعمل على الهواتف الذكية الحديثة، وتشير التقارير إلى إمكانية تشغيل نموذج الـ 2B على أي iPhone حديث.
Qwen3.5-4B: توازن ممتاز للأجهزة المحمولة والأنظمة المدمجة.
Qwen3.5-9B: أذكى نموذج تحت 10B بارامتر وفق مؤشر الذكاء (Intelligence Index)، حيث حقق المرتبة 32 على المؤشر.

النماذج المتوسطة والكبيرة

طرح فريق Qwen أيضاً نماذج أكبر تستهدف بيئات التطوير والاستخدام المؤسسي:

Qwen3.5-27B: مصمم للمهام المعقدة التي تحتاج قدرات متقدمة دون الحاجة لموارد ضخمة.
Qwen3.5-35B-A3B: نموذج MoE (Mixture of Experts) يُنشّط 3 مليار بارامتر فقط عند الاستدلال من أصل 35 مليار، مما يوفر توازناً استثنائياً بين الأداء والكفاءة.
Qwen3.5-122B-A10B: النموذج الأكبر في السلسلة بـ 122 مليار بارامتر (ينشّط 10 مليار منها).

لماذا تستحق سلسلة Qwen3.5 الاهتمام؟

أُطلقت الطرازات الكبيرة من Qwen3.5 في فبراير 2026 وأحدثت موجة في مشهد النماذج المفتوحة المصدر. أبرز ما يميز هذه السلسلة:

مفتوحة المصدر بالكامل: متاحة على HuggingFace مجاناً للاستخدام التجاري وغير التجاري.
دعم عربي قوي: تتميز نماذج Qwen بدعم ممتاز للغة العربية — تابع أخبار AI الأسبوعية لمتابعة آخر الإصدارات مقارنةً بكثير من البدائل المفتوحة.
أحجام متعددة لكل الاحتياجات: من 0.8B للأجهزة المدمجة وحتى 122B للخوادم عالية الأداء.
بنية MoE للكفاءة: تتيح بنية Mixture of Experts تقليل تكلفة الاستدلال مع الحفاظ على جودة مرتفعة.

النموذج	البارامترات الكلية	البارامترات النشطة	الاستخدام المثالي
Qwen3.5-0.8B	0.8B	0.8B	أجهزة IoT والهواتف القديمة
Qwen3.5-2B	2B	2B	الهواتف الذكية الحديثة
Qwen3.5-4B	4B	4B	الأجهزة المحمولة والـ Edge
Qwen3.5-9B	9B	9B	الحواسيب الشخصية (الأذكى تحت 10B)
Qwen3.5-27B	27B	27B	المهام المعقدة – GPU متوسط
Qwen3.5-35B-A3B	35B (MoE)	3B	كفاءة عالية بموارد منخفضة
Qwen3.5-122B-A10B	122B (MoE)	10B	أعلى جودة على الخوادم

مقارنة شاملة بين النماذج

المعيار	GPT-5.4	Claude Code Security	Qwen3.5 (المفتوحة)
الشركة	OpenAI	Anthropic	Alibaba (Qwen)
النوع	مغلق المصدر	مغلق (معاينة)	مفتوح المصدر
التخصص	عام + برمجة + Computer Use	أمن الكود	عام متعدد الأحجام
نافذة السياق	1M رمز	—	تتفاوت حسب الحجم
التكلفة	مدفوع (API/ChatGPT)	اشتراك Enterprise	مجاني
التشغيل المحلي	❌	❌	✅
دعم العربية	ممتاز	جيد	ممتاز

الخلاصة

مارس 2026 يُثبت أن سباق الذكاء الاصطناعي يتسارع على جبهات متعددة في آنٍ واحد: OpenAI ترفع السقف بـ GPT-5.4 الذي يتجاوز الإنسان في مجالات مهنية حيوية، وAnthropic تُضيف بُعداً أمنياً عميقاً عبر Claude Code Security الذي يفهم الكود بدلاً من مجرد فحصه، فيما تُديم Alibaba انفتاح النظام البيئي بسلسلة Qwen3.5 التي تُتيح للجميع الوصول لنماذج قوية دون قيود تجارية.

المستقبل القريب سيكشف كيف ستنعكس هذه التطورات على الإنتاجية المهنية وأمن البرمجيات والتطبيقات المحلية المدعومة بالذكاء الاصطناعي — لكن المؤكد أن الفجوة بين ما كان مستحيلاً وما بات ممكناً تضيق — خاصةً في مجال Function Calling في نماذج LLM بشكل غير مسبوق.

المصادر

Introducing GPT-5.4 – OpenAI – 5 مارس 2026
GPT-5.4 Thinking System Card – OpenAI – 5 مارس 2026
Claude Code Security – Anthropic – مارس 2026
Qwen Models on HuggingFace – مارس 2026
OpenAI releases Codex for Windows – SD Times – مارس 2026
Qwen 3.5 Developer Guide – LushBinary – 2026
Qwen 3.5 Small Model Series Release – 1 مارس 2026
Run long horizon tasks with Codex – OpenAI Developers – 2026

عن الكاتب

فريق Lira Now متخصص في تغطية أحدث تطورات الذكاء الاصطناعي وتحليلها للقارئ العربي بدقة ووضوح.