توليد الصور عبر تطبيقات المدعومة بالذكاء الاصطناعي
نشر :
منذ 5 دقائق|
اخر تحديث :
منذ دقيقتين|
- جوجل تطلق نموذج “Nano Banana”: ثورة في تعديل الصور بالذكاء الاصطناعي
أعلنت شركة جوجل DeepMind، الثلاثاء، عن إطلاق نموذجها الجديد “Nano Banana” (الموزة النانوية)، وهو نظام متقدم لتحرير الصور بالذكاء الاصطناعي مصمم ليكون المحرك الأساسي للتحديثات القادمة في تطبيق Gemini. ويمثل هذا النموذج قفزة نوعية في قدرة الذكاء الاصطناعي على معالجة الصور بدقة غير مسبوقة، وقد بدأ طرحه رسمياً للمستخدمين حول العالم.
وداعاً لمشكلة “التشابه غير الكامل”
يحل نموذج “Nano Banana” إحدى أكبر المشكلات التي تواجه نماذج توليد الصور، وهي “التشابه غير الكامل”، والتي كانت تؤدي إلى فقدان واقعية الصور عند إجراء تعديلات جوهرية. ويركز النموذج الجديد على الحفاظ الدقيق على الهوية البصرية للشخص أو العنصر، حتى عند تغيير الملابس أو تسريحات الشعر أو حتى وضع شخصية في سياق ومكان مختلفين تماماً، مما يضمن ثبات الملامح والتفاصيل.
مزايا إبداعية تتجاوز الحدود
يقدم “Nano Banana” مجموعة من الإمكانيات المتقدمة التي تفتح آفاقاً واسعة أمام المستخدمين، أبرزها:
تغيير السياق: يمكن للمستخدمين نقل صورهم الشخصية إلى حقب زمنية مختلفة أو ارتداء أزياء متنوعة مع الحفاظ التام على ملامح وجوههم.
دمج المشاهد: أصبح من الممكن دمج عناصر من صور متعددة بسلاسة، كوضع صورة شخصية مع حيوان أليف على أرض ملعب رياضي في مشهد واحد متكامل.
تحرير متعدد المراحل: يتيح النموذج إجراء تعديلات متتالية على الصورة خطوة بخطوة، مثل تغيير لون جدار في غرفة ثم إضافة أثاث، مع الحفاظ على بقية عناصر الصورة ثابتة.
مزج التصاميم: يمكن استلهام الأنماط والألوان من صورة وتطبيقها على أخرى، مثل تصميم فستان بنقشة مستوحاة من جناح فراشة، أو تلوين حذاء بألوان زهرة.
تفوق في اختبارات الأداء
أظهرت البيانات الصادرة عن منصة LMArena، المتخصصة في تقييم نماذج الذكاء الاصطناعي، تفوقاً واضحاً لنموذج Gemini 2.5 Flash Image المدعوم بتقنية Nano Banana. وحقق النموذج أعلى تقييم في “التفضيل العام” لدى المستخدمين مقارنة بنماذج منافسة رائدة مثل ChatGPT-4o وFLUX.1 Kontext.
وتشير النتائج إلى أن النموذج الجديد نجح في تحقيق توازن مثالي بين رضا المستخدمين المرتفع ومعدل الأداء السريع، وهو ما يعكس نضجاً تقنياً يجمع بين الجودة والسرعة.
التوفر والشفافية
أكدت جوجل أن نموذج “Nano Banana” أصبح متاحاً لجميع مستخدمي تطبيق Gemini بنسختيه المجانية والمدفوعة. كما سيتم توفيره تدريجياً للمطورين عبر واجهة Gemini API ومنصتي Google AI Studio وVertex AI.
والتزاماً بالشفافية، ستحمل كل صورة يتم إنشاؤها أو تعديلها عبر Gemini علامة مائية مرئية، بالإضافة إلى علامة رقمية خفية (SynthID)، للتأكيد بوضوح على أنها معدلة بواسطة الذكاء الاصطناعي.