مايكروسوفت تطلق أداة لتحويل صورة واحدة إلى فيديو كامل

ابتكر باحثون من شركة مايكروسوفت أداة ذكاء اصطناعي قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي جداً لـ"وجه يتكلّم"، حسب وثيقة نشرتها الشركة هذا الأسبوع.

وأشارت الشركة إلى أن "هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع"، لافتة إلى أنّ "الأداة، وعلى غرار تقنيات إنشاء محتوى أخرى، قد تُستخدم لأهداف مسيئة وانتحال صفة أيّ كان".

【Microsoftの新技術が凄い】

一枚の画像からこんな動画が作れるらしい。
VASA-1というツール。

このモナリザも怖いけど、生成AIの発展のスピードが早すぎて怖い（笑） pic.twitter.com/VMuaZuzus2
— まつむら@生成AIの学校代表 (@investor_y11a) April 20, 2024

ويثير النمو السريع للذكاء الاصطناعي التوليدي، الذي يتيح بسهولة إنتاج مختلف أنواع المحتوى بجودة عالية جداً، مخاوف كثيرة خصوصاً من الاستغلال للاحتيال والتضليل.
وأكّدت مايكروسوفت أن "بحثنا يركز على الصور الرمزية الافتراضية أفاتار للاستخدام الإيجابي"، مضيفة "نعارض أي سلوك يهدف إلى إنشاء محتوى مضلل أو ضار".

2. Realismo y viveza - ejemplo 1 pic.twitter.com/bnc44C9htE
— Adam (@Adamaestr0_) April 19, 2024

ولا تعتزم الشركة وهي مستثمر رئيسي في "اوبن إيه آي" مبتكرة برنامج "شات جي بي تي"، إتاحة الأداة الجديدة أو تقديم معلومات تقنية "طالما أننا غير متأكدين من أنها ستُستخدم بشكل مسؤول حسب القوانين المعمول بها".
ويلتقط البرنامج المسمى "فاسا-1"صورة وجه بسيطة ويسجل مقطعاً صوتياً ويحولهما إلى شريط فيديو يظهر وجهاً يتحرك ويتكلم بطريقة واقعية جداً.

مايكروسوفت تُعلن عن برنامجها الجديد للذكاء الاصطناعي VASA-1.

ترفع صورة ثابته مع مقطع صوتي فيتعرف الذكاء الاصطناعي على نبرة الصوت فيحول الصورة الى فيديو بنفس نبرة الصوت ويضيف تعابير للوجه حسب سياق الكلام

البرنامج لازال تحت الاختبار ولم يتم تحديد موعد لإطلاقه.#أنتبه لاتصدق اي… pic.twitter.com/bgO6jYiRGy
— خالد الريسي (@khalid7_OM) April 19, 2024

وتعمل شركات أخرى على هذه التقنية، على غرار "رَنواي" المتخصصة في الذكاء الاصطناعي التوليدي للفيديو. وأنشأ باحثون من غوغل برنامج ذكاء اصطناعي مسمى "فلوغر" قادر على إنشاء مقاطع فيديو واقعية لوجوه ناطقة.
وأشارت مايكروسوفت إلى أنّ فوائد ابتكار هذه الأداة "مثل تعزيز المساواة في التعليم، ومساعدة الذين يعانون صعوبات في التواصل، وتوفير الدعم العلاجي لمَن يحتاجونه"، تبرر العمل عليها.