أظهر تقرير بحثي حديث نتائج صادمة لاختبار عالمي يعرف باسم Apex-Agents، الذي صُمم لتقييم قدرة وكلاء الذكاء الاصطناعي على أداء مهام وظائف الياقات البيضاء في قطاعات البنوك والاستشارات والقانون. وكشفت النتائج أن أفضل النماذج الحالية، بما فيها Gemini 3 Flash من جوجل، لم تتجاوز نسبة نجاحها في تنفيذ المهام المطلوبة 24% فقط، ما يضع وعود الأتمتة الشاملة للشركات تحت مجهر النقد العلمي والتقني.
وأشارت التقارير التقنية وموقع AI Agent Store إلى أن المشكلة الأساسية تكمن في عدم قدرة الوكلاء على التعامل مع المعلومات المتناثرة عبر أدوات متعددة مثل Slack وGoogle Drive بنفس كفاءة البشر. وأوضح الباحثون أن الوكلاء يعانون من فقدان السياق عند التنقل بين المنصات المختلفة، مما يؤدي إلى أخطاء كبيرة في اتخاذ القرارات أو تنفيذ الأوامر الإدارية، وهو ما يعني أن التحول نحو بيئة عمل آلية بالكامل لا يزال بعيد المنال.
تشير النتائج إلى أن الاعتماد على “القوة العاملة السيليكونية” قد يستغرق وقتاً أطول بكثير مما توقعته شركات التكنولوجيا الكبرى. وأكدت التقارير أن أكثر من نصف قادة الشركات يرون أن المخاوف الأمنية والامتثال تشكل العائق الأكبر أمام نشر هؤلاء الوكلاء، حيث يشترط الغالبية وجود رقابة بشرية كاملة على كل قرار يتخذه الذكاء الاصطناعي لضمان سلامة العمليات التجارية والمالية من الأخطاء العشوائية.
وأثبتت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة بالغة في التنسيق بين المهام المتعددة التي تتطلب فهماً دلالياً متغيراً، مما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية مغامرة تقنية غير محسوبة النتائج حالياً.
ويتفق خبراء الأمان على أن الموثوقية والحوكمة تظلان أهم من القدرات الحسابية الخام، إذ يتطلب بناء وكلاء ناجحين إعادة تصميم العمليات التشغيلية داخل المؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة، لضمان أعلى مستويات الدقة والأمان الرقمي.
👁️
المشاهدات
…
⏱️
وقت القراءة
0 د
📅
تاريخ النشر
25/01/2026
♻️
آخر تحديث
25/01/2026

.png)