Sora: OpenAI تطلق أداة تقوم بإنشاء فيديو على الفور من النص | الذكاء الاصطناعي (AI)


كشفت OpenAI يوم الخميس عن أداة يمكنها إنشاء مقاطع فيديو من المطالبات النصية.

يمكن للنموذج الجديد، الملقب بـ Sora نسبة إلى الكلمة اليابانية التي تعني “سماء”، إنتاج لقطات واقعية تصل مدتها إلى دقيقة واحدة تلتزم بتعليمات المستخدم فيما يتعلق بالموضوع والأسلوب. وفقًا لمنشور مدونة للشركة، فإن النموذج قادر أيضًا على إنشاء مقطع فيديو استنادًا إلى صورة ثابتة أو توسيع اللقطات الموجودة بمواد جديدة.

وجاء في منشور المدونة: “نحن نعلم الذكاء الاصطناعي لفهم ومحاكاة العالم المادي المتحرك، بهدف نماذج التدريب التي تساعد الأشخاص على حل المشكلات التي تتطلب تفاعلًا في العالم الحقيقي”.

أحد مقاطع الفيديو التي تم تضمينها من بين عدة أمثلة أولية من الشركة كان يعتمد على المطالبة التالية: “مقطع دعائي لفيلم يعرض مغامرات رجل الفضاء البالغ من العمر 30 عامًا والذي يرتدي خوذة دراجة نارية محبوكة من الصوف الأحمر، وسماء زرقاء، وصحراء مالحة، بأسلوب سينمائي، لقطة على فيلم مقاس 35 ملم، بألوان زاهية.

أعلنت الشركة أنها فتحت الوصول إلى Sora لعدد قليل من الباحثين ومنشئي الفيديو. سيقوم الخبراء بـ “الفريق الأحمر” للمنتج – واختبار مدى قابليته للالتفاف على شروط خدمة OpenAI، التي تحظر “العنف الشديد، أو المحتوى الجنسي، أو الصور التي تحض على الكراهية، أو شبه المشاهير، أو الملكية الفكرية للآخرين”، وفقًا لمنشور مدونة الشركة. وتسمح الشركة فقط بوصول محدود للباحثين والفنانين البصريين وصانعي الأفلام، على الرغم من أن الرئيس التنفيذي سام ألتمان استجاب لمطالبات المستخدمين على تويتر بعد الإعلان بمقاطع فيديو قال إنها من صنع سورا. تحمل مقاطع الفيديو علامة مائية لإظهار أنها من إنتاج الذكاء الاصطناعي.

أطلقت الشركة لأول مرة مولد الصور الثابتة Dall-E في عام 2021 وروبوت الدردشة المولد بالذكاء الاصطناعي ChatGPT في نوفمبر 2022، والذي جمع بسرعة 100 مليون مستخدم. وقد طرحت شركات الذكاء الاصطناعي الأخرى أدوات إنشاء الفيديو لأول مرة، على الرغم من أن هذه النماذج لم تكن قادرة إلا على إنتاج بضع ثوانٍ فقط من اللقطات التي غالبًا ما لا علاقة لها بمطالباتها. قالت شركتا Google وMeta إنهما بصدد تطوير أدوات فيديو توليدية، على الرغم من أنهما لم تصدراها للعامة. وأعلنت يوم الأربعاء عن تجربة لإضافة ذاكرة أعمق إلى ChatGPT حتى يتمكن من تذكر المزيد من محادثات مستخدميه.

لم تكشف OpenAI عن مقدار اللقطات التي تم استخدامها لتدريب Sora أو المكان الذي قد تكون نشأت فيه مقاطع الفيديو التدريبية، بخلاف إخبار صحيفة نيويورك تايمز أن المجموعة تحتوي على مقاطع فيديو كانت متاحة للجمهور ومرخصة من أصحاب حقوق الطبع والنشر. تمت مقاضاة الشركة عدة مرات بتهمة انتهاك حقوق الطبع والنشر في تدريب أدوات الذكاء الاصطناعي التوليدية الخاصة بها، والتي تستوعب كميات هائلة من المواد المستخرجة من الإنترنت وتقليد الصور أو النصوص الموجودة في مجموعات البيانات تلك.




اكتشاف المزيد من شبكة الريان

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من شبكة الريان

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading