أطلقت شركة Black Forest Labs نموذجها الجديد Flux 2، الجيل الأحدث من نماذج توليد الصور بالذكاء الاصطناعي، الذي يقدم تحسينات كبيرة تشمل دعم مخرجات بدقة تصل إلى أربعة ميجابكسل والقدرة على معالجة عدة صور مرجعية في وقت واحد.
ويأتي إطلاق Flux 2 بعد فترة قصيرة من كشف جوجل عن نموذج Nano Banana Pro، ما يجعل المقارنات بين النموذجين محورًا رئيسيًا لنقاشات مجتمع الذكاء الاصطناعي في الأسابيع القادمة.
ويمتاز Flux 2 بإمكانية استقبال ما يصل إلى عشر صور مرجعية، ما يضمن الحفاظ على اتساق الشخصيات أو المنتجات أو الأسلوب البصري بين المخرجات المختلفة، ويتيح إنشاء الصور وتحريرها بالدقة العالية نفسها. وقد اعتبرت الشركة نظام تعدد الصور المرجعية أبرز التطورات في هذه النسخة.
كما شهدت قدرات النموذج في توليد النصوص داخل الصور تحسينًا ملحوظًا، حيث أصبح ينتج خطوطًا أوضح ورسومًا معلوماتية أكثر دقة، مع التزام أفضل بالتعليمات النصية حتى في التركيبات المعقدة.
يعتمد Flux 2 على هيكلية مزدوجة تضم نموذج رؤية لغوي يُعرف باسم Mistral-3 24B لمعالجة النصوص والصور معًا، إلى جانب وحدة مسؤولة عن ضبط منطق التخطيط والتحقق من دقة العناصر البصرية مثل الأشكال والخامات. ويشمل النموذج مُرمّز صور VAE يسمح بتخزين الصور واسترجاعها بكفاءة دون فقدان الجودة، ما يمكّنه من توليد محتوى جديد أو تعديل الصور الموجودة بسهولة.
وتطرح الشركة عائلة Flux 2 بأربع إصدارات رئيسية موجهة لفئات مختلفة من المستخدمين، منها إصدار Pro الأعلى جودة لمضاهاة أداء النماذج المغلقة المتقدمة، وإصدار Flex المخصص للمطورين الراغبين في التحكم بالإعدادات لتحقيق توازن بين السرعة والجودة، وإصدار Dev الذي يجمع التوليد النصي والصوري مع تحرير الصور في نموذج واحد، إضافة إلى إصدار Klein المقطّر مفتوح المصدر بترخيص Apache 2.0، والذي لم يُطرح بعد.
وتؤكد Black Forest Labs أن عائلة Flux 2 تحقق نتائج قوية في معايير التقييم المختلفة مع الحفاظ على تكلفة تشغيل منخفضة، مما يجعلها خيارًا اقتصاديًا وجاذبًا مقارنةً بالنماذج المنافسة من جوجل و OpenAI.

