Gemini Omni AI هي عائلة نماذج إبداعية متعددة الوسائط من Google، قُدمت في Google I/O 2026. أول نموذج فيها هو Gemini Omni Flash، ويبدأ بالفيديو: يمكن للمستخدم الجمع بين النصوص والصور والمقاطع الموجودة وإشارات الصوت، ثم طلب إنشاء الفيديو أو تعديله من خلال محادثة.
الفكرة المهمة ليست أن Gemini Omni يستطيع إنشاء الفيديو فقط. الأهم أن Google تحاول تحويل فيديو الذكاء الاصطناعي من نتيجة واحدة بعد prompt واحد إلى مسار عمل قابل للتعديل.
ماذا يعني Gemini Omni AI؟
كلمة "Omni" تشير إلى المدخلات. النص يشرح الهدف، الصورة تحدد المنتج أو الشخصية، الفيديو يوضح الحركة، والصوت يعطي الإيقاع أو الجو العام.
Gemini Omni Flash هو أول إصدار عام من هذه العائلة. تقول Google إنه يصل عبر تطبيق Gemini وGoogle Flow وYouTube Shorts، مع اختلاف الإتاحة بحسب المنطقة والمنتج ونوع الحساب.
لذلك Gemini Omni ليس أداة ضيقة لتحويل النص إلى فيديو فقط. هو أقرب إلى مساعد إبداعي يفهم المراجع، ينشئ نسخة أولى، ثم يساعدك على تعديلها.
ماذا يستطيع Gemini Omni Flash أن يفعل؟
التركيز الحالي هو إنشاء الفيديو وتحريره. أهم القدرات هي:
- إنشاء فيديو من prompts نصية؛
- استخدام الصور كمراجع للأشخاص أو المنتجات أو الأسلوب أو التكوين؛
- استخدام الفيديو كمرجع للحركة والكاميرا؛
- استخدام الصوت لتوجيه الإيقاع أو الحالة؛
- تعديل مقطع بتعليمات طبيعية؛
- الحفاظ على السياق عبر عدة جولات من التعديل.
النقطة الأخيرة هي الأهم عمليًا. مشكلة فيديو الذكاء الاصطناعي غالبًا لا تظهر في النسخة الأولى، بل في التصحيح الثاني أو الثالث. إذا كان كل تعديل يعني إعادة توليد كاملة، يصبح العمل غير مستقر.
Gemini Omni و Veo
Veo هي عائلة نماذج الفيديو المعروفة من Google، وترتبط بالجودة السينمائية، فهم prompts، الحركة الواقعية وقدرات الصوت في الإصدارات الحديثة.
أما Gemini Omni فهو طبقة إبداعية أوسع داخل منظومة Gemini. Veo يبدو كخط نماذج، بينما Gemini Omni يبدو كتجربة استخدام: أضف مراجع، صف النتيجة، أنشئ مسودة، ثم واصل التعديل.
إذا كنت تقارن أسماء النماذج، فـ Veo ما زال مهمًا. أما إذا أردت فهم طريقة Google في تقديم فيديو الذكاء الاصطناعي بعد I/O 2026، فاسم Gemini Omni هو الأكثر فائدة.
مسار عمل عملي
ابدأ بهدف واضح: فيديو منتج، إعلان قصير، شرح بصري، لقطة سينمائية أو اختبار أسلوب. أضف مراجع تقلل الغموض، ثم اطلب نسخة أولى.
التعليمات الجيدة تصف التغير مع الوقت وتحدد ما يجب أن يبقى ثابتًا. بدل قول "اجعله أفضل"، قل مثلًا: "حافظ على شكل المنتج ومكان الشعار وحركة الكاميرا، وغيّر الخلفية إلى استوديو دافئ واجعل آخر ثانيتين أبطأ."
من يستفيد منه؟
Gemini Omni مفيد عندما تكون السرعة والمراجعة مهمتين. يمكن لصناع المحتوى إعداد مقاطع اجتماعية، وفرق التسويق اختبار أفكار المنتجات، والمعلمين إنتاج شروحات بصرية، والمصممين أو المخرجين تجربة الحركة والمزاج قبل الإنتاج.
أفضل استخدام له هو التكرار السريع: إنشاء مسودة، تعديلها، مقارنة النسخ، والاحتفاظ بما يعمل.
الخلاصة
Gemini Omni AI هو محاولة Google لجعل فيديو الذكاء الاصطناعي أكثر تعددًا في المدخلات، وأكثر قابلية للتحرير، وأكثر اعتمادًا على المحادثة. يبدأ Gemini Omni Flash بالفيديو، لكن الفكرة الأكبر هي مسار عمل يجمع بين prompts والمراجع والتعديلات.
إذا كان Veo يمثل تاريخ Google في نماذج الفيديو، فإن Gemini Omni يمثل اتجاه تجربة المستخدم القادمة.

