ميتا تعلن عن نموذج ذكاء اصطناعي جديد لتوليد الصور

Wazcam, تم النشر 2023/07/15 11:22

أعلنت شركة ميتا عن نموذج جديد للذكاء الاصطناعي تطلق عليه اسم "CM3Leon"، لتوليد الصور استنادًا إلى الأوامر النصية.

ويتميز هذا النموذج، بأدائه ذي الحالة الفنية المتطورة لتوليد صور أكثر اتساقًا مع الأوامر النصية، إذ إنه أكثر كفاءة، ويتطلب حوسبة أقل بخمس مرات، ومجموعة بيانات أصغر للتدرب مقارنةً بالنماذج الأخرى.

وتعتمد معظم مولدات الصور التي تعمل بالذكاء الاصطناعي على تقنية تُعرف باسم "الانتشار Diffusion" وهي تقنية تتطلب حوسبة أكبر فضلًا عن كونها بطيئة ومكلفة لتشغيلها، وهي موجودة في أدوات مثل DALL-E التي تطورها شركة OpenAI، و Imagen التي تطورها جوجل، بالإضافة إلى Stable Diffusion وغيرها.

ويعتمد نموذج ميتا CM3Leon على تقنية مختلفة تُعرف باسم "الاهتمام Attention" تجعل النموذج أسرع في التدرب وخلق النتائج وأقل كلفة في التشغيل.

ويتفرد نموذج "CM3Leon" بقدرته على توليد وصف للصور، مما يمهد الطريق لنماذج فهم الصور ذات القدرات الأكبر في المستقبل، وفقاً للشركة.

وقالت ميتا عبر مدونتها الرسمية، إن من خلال قدرات CM3Leon يمكن لأدوات توليد الصور إنتاج صور أكثر اتساقًا وفقًا للإرشادات النصية المدخلة، ونحن نعتقد أن الأداء القوي للنموذج عبر مجموعة متنوعة من المهام يمثل خطوة نحو تحسين جودة توليد الصور وفهمها.

واستخدمت ميتا ملايين الصور المرخصة من شركة Shutterstock من أجل تدريب "CM3Leon"، وتحتوي أقوى نسخة من النموذج على 7 مليارات معامل، أي أكثر من ضعف ما يحتوي عليه نموذج DALL-E 2 التابع لشركة OpenAI، ويعد المعامل Parameter وحدة قياس لمهارة النموذج وقدراته.

ويمكن استخدام "CM3Leon" في مجموعة واسعة من التطبيقات، مثل الواقع الافتراضي والواقع المعزز والروبوتات والإعلان والتسويق.

ولم تحدد ميتا موعد إصدار نموذج "CM3Leon" أو ما إذا كانت تنوي إطلاقه كاملًا للجمهور، ومن المتوقع أن تكشف ميتا المزيد من التفاصيل حول النموذج في وقتٍ لاحق.