أداة إنتاج الفيديو Sora التابعة لـ OpenAI أثارت إعجاب مجتمع الذكاء الاصطناعي في فبراير بفيديو واقعي سلس يبدو أفضل بكثير من منافسيها. ومع ذلك، فإن الطريقة التي تم بها تقديم الأداة للعلن تركت الكثير من التفاصيل غير معروضة — تفاصيل تم استيفاؤها من قبل صانع أفلام حصل على وصول مبكر لإنشاء فيلم قصير باستخدام Sora.
شركة Shy Kids هي فريق إنتاج رقمي مقره في تورونتو تم اختياره من قبل OpenAI كواحدة من الشركات القليلة لإنتاج أفلام قصيرة أساساً لأغراض الترويج لـ OpenAI، وعلى الرغم من ذلك، فقد حصلوا على حرية إبداعية كبيرة في إنشاء “الهواء الرأسي”. في مقابلة مع منصة fxguide لأخبار الرسوم المتحركة، وصف الفنان في مرحلة ما بعد الإنتاج باتريك سيديربيرغ “استخدام Sora بالفعل” كجزء من عمله.
ربما أهم ما يمكن استخلاصه ببساطة لمعظم الناس هو أن الأفلام التي تم التركيز عليها في منشور OpenAI كانت بمثابة إنتاجات محترفة، مع عملية تخطيط قوية، وتحرير، وتصحيح للألوان، وعمليات ما بعد الإنتاج مثل الرسم على الصور المتحركة والتأثيرات البصرية. تمامًا كما تقول شركة Apple “مصور بواسطة iPhone” ولكن لا تظهر إعدادات الاستوديو الاحترافية والإضاءة والعمل اللوني بعد ذلك. المنشور حول Sora يتحدث فقط عن القدرات التي يمكنها توفيرها للأفراد، ولكنه لا يتطرق إلى كيفية العمل الفعلي.
المقابلة مع سيديربيرغ مثيرة للاهتمام وغير تقنية تمامًا، لذا إذا كنت مهتمًا، يمكنك قراءتها على fxguide. ولكن هنا بعض النقاط المثيرة حول استخدام Sora التي توضح لنا أن النموذج، على الرغم من روعته، قد لا يكون قفزة ضخمة إلى الأمام كما كان يعتقد.
في هذه المرحلة، لا يزال السيطرة هي الشيء الأكثر رغبة والأكثر تحقيقًا. … أقرب ما يمكن أن نفعله هو أن نكون وصفًا مفصلًا للغاية في ملمحاتنا. شرح الزي للشخصيات، بالإضافة إلى نوع البالون، كانت طريقتنا للتعامل مع عدم التناسق، لأنه من لقطة إلى أخرى، أو من جيل إلى جيل في إنتاج الفيديو، لا توجد ميزات متاحة حتى الآن للسيطرة الكاملة على التناسق.
بمعنى آخر، الأمور البسيطة في صناعة الأفلام التقليدية، مثل اختيار لون ملابس شخصية معينة، تتطلب إجراءات معقدة وفحوصات دقيقة في نظام الإنتاج التوليدي، لأن كل لقطة يتم إنشاؤها بشكل مستقل عن الأخرى. يمكن أن يتغير هذا بوضوح في المستقبل، لكنه بالتأكيد يتطلب المزيد من الجهد في الوقت الحالي.
على مراقبي إخراج Sora أن يكونوا حذرين من وجود عناصر غير مرغوب فيها: وصف سيديربيرغ كيف ينشأ النموذج بانتظام وجهًا على البالون الذي يحمله الشخصية الرئيسية بدلاً من الرأس، أو خيطًا يتدلى في الجزء الأمامي. وكان عليهم إزالة هذه العناصر في مرحلة ما بعد الإنتاج، وهو عمل يستغرق وقتًا طويلاً، إذا لم يتمكنوا من توجيه الدالة لاستبعادها.
لا يمكن تحديد التوقيت الدقيق والحركات للشخصيات أو الكاميرا بشكل فعال: “هناك قدر ضئيل من السيطرة على التوقيت حول مكان حدوث هذه الإجراءات المختلفة في التوليد الفعلي، ولكنه ليس دقيقًا … إنها نوع من الرمي في الظلام”، كما قال سيديربيرغ.
على سبيل المثال، توقيت حركة مثل موجة يعتمد بشكل كبير على التقدير، بخلاف الرسوم المتحركة اليدوية. ولقطة مثل انتقال الكاميرا لأعلى على جسم الشخصية قد تعكس ما يريده صانع الفيلم أو قد لا تعكسه — لذا قام الفريق في هذه الحالة بتقديم لقطة مركبة بتوجيه عمودي وقام بانتقائها في مرحلة ما بعد الإنتاج. وكانت المقاطع المولدة في كثير من الأحيان ببطء زمني دون سبب محدد.
في الواقع، ووفقًا لما قاله سيديربيرغ، كان استخدام لغة صناعة الأفلام اليومية، مثل “التحريك لليمين” أو “التصوير المتتبع”، غير متسق بشكل عام، مما وجده الفريق مفاجئًا تمامًا.
وأشار إلى أن الباحثين، قبل أن يتواصلوا مع الفنانين لاستخدام الأداة، لم يكونوا يفكرون حقًا مثل صانعي الأفلام.
نتيجة لذلك، قام الفريق بمئات الأجيال، كل منها تمتد من 10 إلى 20 ثانية، وانتهى بهم الأمر إلى استخدام عدد قليل فقط. وقد قدر سيديربيرغ النسبة بنسبة 300:1 — ولكن بالطبع قد يفاجئنا الجميع هذا النسب في سياق التصوير العادي.
بصورة فعلية، قام الفريق بإنتاج فيديو قصير خلف الكواليس لشرح بعض المشاكل التي واجهوها، إذا كنت مهتمًا. ومثل الكثير من المحتوى المرتبط بالذكاء الاصطناعي، فإن التعليقات كانت تعبر عن انتقادات شديدة للمهمة بشكل عام — على الرغم من أنها ليست بنفس درجة الحدة التي شاهدناها مؤخرًا في الإعلان المساعد بالذكاء الاصطناعي الذي تم سخريته.
في النهاية، هناك تفاصيل مثيرة للاهتمام تتعلق بحقوق النشر: إذا طلبت من Sora إنتاج فيديو “حرب النجوم”، فسترفض الطلب. وحتى إذا حاولت الوصول لذلك بوصف “رجل مغطى بالرداء يحمل سيف ليزر على مركبة فضائية مستقبلية”، ستقوم Sora أيضًا برفض الطلب، حيث يتم التعرف بطريقة ما على محاولتك. بالإضافة إلى ذلك، رفضت Sora أيضًا عمل “لقطة بنمط أرونوفسكي” أو “تكبير هيتشكوك”.
من ناحية، يبدو هذا مُنطقًيًا تمامًا. ومع ذلك، فإنه يثير السؤال: إذا كانت Sora تعرف هذه الأمور، هل يعني ذلك أن النموذج تم تدريبه على هذا المحتوى للتعرف على انتهاك حقوق النشر بشكل أفضل؟ ومع ما تتمتع به OpenAI من سرية تامة بخصوص بيانات التدريب — حتى درجة السخرية، كما في مقابلة مدير التكنولوجيا ميرا موراتي مع جوانا ستيرن — فمن المؤكد تقريبًا أنها لن تقدم لنا إجابة على هذا السؤال.
أما بالنسبة لـ Sora واستخدامها في صناعة الأفلام، فإنها بوضوح أداة قوية ومفيدة في مجالها، ولكن ليس مناسبًا لـ “خلق أفلام من العدم” حتى الآن. وكما قال شخصية الشر في إحدى الأفلام بشهرة: “هذا يأتي لاحقًا”.
الخلاصة
المقال يقدم نظرة عامة على أداة إنتاج الفيديو Sora التابعة لـ OpenAI وكيف تم استخدامها في إنتاج أفلام قصيرة بواسطة فريق Shy Kids. يتم التركيز في المقال على الجوانب التقنية والإبداعية لاستخدام Sora، بما في ذلك التحديات التي واجهها الفريق في توجيه النموذج وتحقيق التناسق في الإنتاج الفني. كما يتم التطرق إلى القضايا المتعلقة بحقوق النشر والتحديات التي يمكن أن يواجهها النموذج في توليد محتوى يتعارض مع حقوق الطبع والنشر. في النهاية، يتم التأكيد على أن Sora تظل أداة قوية ومفيدة في صناعة الأفلام، لكنها لا تزال بعيدة عن القدرة على “خلق أفلام من العدم”، مما يشير إلى أهمية التطوير المستقبلي للتقنية.
مصدر الخبر
موقع : techcrunch
أخيرا
نتمنى لك قراءة رائعة، لا تنسى قراءة هذه الصفحات المهمة، إخلاء المسؤولية ، سياسة الخصوصية و أيضاً تسجيل رأيك
حول “تشريح لمنشئو الفيلم قوة وضعف أداة إنتاج الفيديو Sora” شاركنا رأيك عبر صفحاتنا على مواقع التواصل الأجتماعي و أيضاً لا تنسى متابعتنا : (فيسبوك ، انستغرام ،تويتر)
شاهد أيضاً :
تستهدف آبل تطوير ميزات ذكاء اصطناعي لآيفون بالتعاون مع OpenAI