أعلنت شركة جوجل في مؤتمر المطورين لعام 2024 عن أدوات إنشاء الوسائط المتعددة بنكهة للذكاء الاصطناعي وأولهم أداة Veo التي تمكنك من إنتاج مقاطع فيديو بجودة عالية بدقة 1080 بيكسل؛ وكذلك أداة Imagen 3 في ثوبها الجديد لتحويل النصوص إلى صور، ولا يبدو أن أي منهما مبتكر بشكل خاص، ولكنهما وسيلة لجوجل للمضي قدمًا في مواجهة أداة الفيديو Sora من OpenAI وأداة Dall-E 3 التي أصبحت تقريبًا مرادفًا للصور التي ينشئها الذكاء الاصطناعي.
تقول جوجل أن أداة Veo تمتلك “فهمًا متقدمًا للغة الطبيعية والدلالة البصرية” لإنشاء أي فيديو تتخيله. يمكن أن تستمر مقاطع الفيديو التي تنشئها الذكاء الاصطناعي “لفترة تزيد عن دقيقة واحدة”. ويمكن لأداة Veo أيضًا فهم التقنيات السينمائية والبصرية، مثل مفهوم تسارع الزمن.
ومازال الأمر مشوشًا فيما يتعلق بنوعية هذه الفيديوهات، فهل هناك من سيكون لديه الرغبة في مشاهدة مقاطع فيديو تعتمد على الذكاء الاصطناعي، وهناك أدوات يمكنها إعادة الماضي بنسخة جديدة، لكن الشركات تحاول الترويج لهذه الأدوات وتسعى لأن تكون مفيدة أو على الأقل تحقق أرباحًا كبيرة.
اقرأ أيضًا: شركة OpenAI تطلق نموذج الذكاء الاصطناعي الجديد GPT-4o
وسترى ميزة Veo متاحة داخل أداة جوجل VideoFX اليوم لبعض المنشئين، وتقول الشركة إنها ستكون متاحة أيضًا على يوتيوب شورتس ومنتجات أخرى، وإذا كانت أداة Veo في النهاية سيصبح جزءًا من فيديوهات يوتيوب القصيرة، فهذه ميزة واحدة على الأقل لجوجل ستساعدها على التفاخر أمام تيك توك وفرد عضلاتها.
أما بالنسبة لأداة Imagen 3 فهي نسخة محدثة وأعلى جودة من أداة تحويل النص إلى الصورة، مع مستوى تفاصيل لا يصدق والحصول على صور واقعية أقرب للطبيعة، وتقول جوجل أنها أداة أذكى في التعامل مع التفاصيل.
كما أن جوجل تعمل أيضًا مع بعض الموسيقيين لاختبار واجهة برمجة تطبيقات الذكاء الاصطناعي الموجهة للموسيقى، وهي مجموعة من الأدوات التي يمكن أن تساعد في إنشاء الأغاني والإيقاعات، لم نر إلا لمحة سريعة عن هذا، ولكنها أدت إلى بعض العروض التجريبية المثيرة.
ونرى أن هذه الميزات والأدوات الجديدة في مجال الذكاء الاصطناعي وبصمة جوجل القوية، ما هي إلا نتيجة لمليارات الدولارات التي يتم ضخها في القطاع الجديد ليصبح واقعًا، وكل ذلك في محاولة لامتلاك النقلة الكبرى التالية في الحوسبة.