برنامج يتيح إجراء مكالمة فيديو حية بواسطة صورة ثنائية الأبعاد

الرابط المختصرhttp://khaleej.online/vzjkwV

تم تدريب النموذج على مجموعة بيانات من 180.000 مقطع فيديو حقيقي

Linkedin
whatsapp
الجمعة، 25-06-2021 الساعة 15:15

ما آلية عمل البرنامج؟

يقوم البرنامج بتحويل الصور ثنائية الأبعاد إلى فيديو متحرك يظهر صورة المستخدم وكأنها تتحرك بشكل واقعي.

ما الخوارزمية التي تم استخدامها؟

يتم تشغيل النموذج "Vid2Vid Cameo" بواسطة خوارزميات متطورة من الذكاء الاصطناعي يطلق عليها "شبكات الخصومة التوليدية (GANs)".

كشفت شركة "نيفادا" (Nvidia) عن نموذج ذكاء اصطناعي يحوّل صورة ثنائية الأبعاد لشخص ما إلى فيديو متحرك.

وقالت الشركة لموقع "ذا فيرج"، اليوم الجمعة: "تم تصميم نموذج التعلم العميق -خوارزمية للذكاء الاصطناعي- المعروف باسم "Vid2Vid Cameo" لتحسين تجربة مؤتمرات الفيديو".

وأضافت: "إذا تأخرت في إجراء مكالمة فيمكنك الاستلقاء على السرير مرتدياً ملابس النوم، وتحميل صورة لك ترتدي ملابس أنيقة، وسيقوم الذكاء الاصطناعي بتعيين حركات وجهك على الصورة المرجعية".

يمكن للنظام ضبط اتجاه العينين بحيث تبدوان وكأنهما تنظران مباشرةً إلى الشاشة.

إنها تبدو وكأنها ميزات رائعة لأولئك الذين يخشون منا مكالمات الفيديو، ولكن الجانب الأكثر فائدة في النموذج قد يكون تقليل النطاق الترددي، بحسب بيان الشركة.

وقالت نيفادا: "إن هذه التقنية يمكن أن تقلل عرض النطاق الترددي اللازم لمؤتمرات الفيديو بما يصل إلى 10x".

يتم تشغيل النموذج "Vid2Vid Cameo" بواسطة خوارزميات متطورة من الذكاء الاصطناعي يطلق عليها "شبكات الخصومة التوليدية (GANs)"، إذ تقوم إحدى الخوارزميات بعمل مولد يحاول إنشاء عينات تبدو واقعية، وَخوارزمية أخرى تحاول معرفة ما إذا كانت الصورة حقيقية أم مزورة.

أثناء مكالمة الفيديو يلتقط النموذج حركته في الوقت الفعلي ويطبقها على الصورة التي تم تحميلها.

تم تدريب النموذج على مجموعة بيانات من 180.000 مقطع فيديو حقيقي يكون رأس المتكلم متحركاً، والتركيز على 20 نقطة رئيسية بما في ذلك الفم والعينين والأنف.

يتم بعد ذلك استخراج هذه النقاط من الصورة التي تم تحميلها بواسطة المستخدم لإنشاء مقطع فيديو يحاكي مظهرها الحقيقي وهي تتحرك.

مكة المكرمة