أطلقت شركة جوجل ميزة جديدة تتيح تحويل أي صورة ثابتة إلى مقطع فيديو قصير مدته 8 ثوانٍ، يتضمن حركة وصوت، وذلك ضمن منصة الذكاء الاصطناعي الخاصة بها. تعتمد هذه الأداة على نموذج الذكاء الاصطناعي المتقدم Veo 3، القادر على تحليل الصور، توليد عمق بصري، تحريك العناصر، وفهم السياق البصري للمشهد.
الميزة الجديدة، التي تم الإعلان عنها لأول مرة في مؤتمر مطوري جوجل في مايو الماضي، أصبحت اليوم متاحة لمشتركي Google AI Pro في أكثر من 150 دولة. ووفقًا لجوجل، فقد تم حتى الآن إنشاء أكثر من 45 مليون مقطع فيديو باستخدام هذه التقنية عبر تطبيق “جِميني” وأداة إنتاج الفيديو Flow.
استخدام الأداة الجديدة بسيط وبديهي: يمكن للمستخدمين اختيار خيار “فيديوهات باستخدام Veo” من قائمة الأدوات في منصة Gemini، رفع صورة، وصف المشهد المطلوب كتابةً أو عبر تعليمات صوتية، وستقوم المنظومة بتحويل الصورة الثابتة إلى مقطع فيديو حيّ. بعد الانتهاء من إنتاج الفيديو، يمكن تنزيله أو مشاركته دون أي قيود.
ولمنع إساءة استخدام هذه التقنية، حرصت جوجل على تزويد النظام بآليات أمان ومراقبة صارمة، تشمل اختبارات “Red Teaming” لرصد الثغرات المحتملة قبل طرح الأداة للمستخدمين، بالإضافة إلى سياسات صارمة ضد المحتوى غير الآمن. كما يتم تمييز كل مقطع يتم إنتاجه باستخدام الذكاء الاصطناعي بعلامات مائية ظاهرة وغير مرئية (عبر تقنية SynthID) تشير إلى مصدره.
يأتي دخول جوجل بقوة إلى هذا المجال في وقت يشهد فيه سوق الفيديو بالذكاء الاصطناعي ازدهارًا غير مسبوق. إلى جانب جوجل، برزت نماذج أخرى مثل Sora من OpenAI، وأدوات RunwayML (Gen-1 وGen-2)، التي تتيح هي الأخرى إنتاج فيديو من نصوص مكتوبة، بالإضافة إلى إمكانيات تحرير فيديو ذكية.
وفي الصين، تعمل شركات مثل Tencent وBaidu على تطوير أدوات مشابهة، ما يزيد من شدة التنافس. غير أن جوجل تراهن على تكامل أدواتها: Veo 3، Gemini، وImagen 4، ضمن منظومة واحدة تتيح للمستخدمين العاديين والمحترفين على حد سواء، إنتاج فيديو بجودة عالية وبتجربة استخدام مرنة.
رغم أن فكرة تحويل الصور إلى فيديو ليست جديدة، فإن الذكاء الاصطناعي نقل هذه التقنية إلى مستوى غير مسبوق. ففي السابق، كان إنتاج فيديو كهذا يتطلب مهارات احترافية وبرامج متقدمة وساعات من العمل. أما اليوم، فبفضل التطورات في الشبكات العصبية والنماذج التوليدية، أصبح بالإمكان تحليل صورة واحدة وفهم مكوناتها وتحويلها إلى مشهد حي بكل عناصره، بضغطة زر.
بهذا الابتكار، تفتح جوجل أبوابًا جديدة أمام صناع المحتوى، وتمنح المستخدم العادي أدوات قوية كانت في السابق حكرًا على المحترفين. يبدو أن المستقبل الذي تُنتج فيه الفيديوهات من مجرد صورة أو وصف قصير، قد بدأ بالفعل.