يمكن لأداة إنشاء الفيديو الجديدة من OpenAI أن تتعلم الكثير من الأطفال | جون نوتون
“Fأولًا النص، ثم الصور، والآن أصبح لدى OpenAI نموذجًا لإنشاء مقاطع الفيديو ماشابل اليوم الآخر. أعلن صانعو ChatGPT و Dall-E للتو عن Sora، وهو نموذج لنشر النص إلى الفيديو. جديلة مثيرة للتعليقات في جميع أنحاء الويب حول ما سيصبح بلا شك معروفًا باسم T2V، والذي يغطي الطيف المعتاد – من “هل يمثل هذا نهاية [insert threatened activity here]؟” إلى “meh” وكل شيء بينهما.
إن Sora (الاسم الياباني يعني “السماء”) ليس أول أداة T2V، لكنها تبدو أكثر تعقيدًا من الجهود السابقة مثل أداة Make-a-Video AI التي طورتها شركة Meta. يمكنه تحويل وصف نصي مختصر إلى مقطع فيلم مفصل عالي الدقة يصل طوله إلى دقيقة واحدة. على سبيل المثال، المطالبة “قطة توقظ صاحبها النائم وتطلب الإفطار. يحاول المالك تجاهل القطة، لكن القطة تحاول تكتيكات جديدة، وفي النهاية، يقوم المالك بسحب مخبأه السري من الحلوى من أسفل الوسادة لإبعاد القطة لفترة أطول قليلاً،” ينتج مقطع فيديو رائع من شأنه أن ينتشر بسرعة كبيرة. على أي شبكة اجتماعية.
لطيف، إيه؟ حسنا، إلى حد ما. يبدو OpenAI صريحًا على نحو غير معهود بشأن قيود الأداة. فقد “تكافح، على سبيل المثال، من أجل محاكاة فيزياء مشهد معقد بدقة”.
هذا بعبارة ملطفة. يوضح أحد مقاطع الفيديو الموجودة في مجموعة العينات الخاصة به الصعوبات التي يواجهها النموذج. الموجه الذي ينتج عنه الفيلم هو “فيديو مقرب واقعي لسفينتين من القراصنة تتقاتلان أثناء إبحارهما داخل فنجان من القهوة”. للوهلة الأولى، إنه مثير للإعجاب. ولكن بعد ذلك يلاحظ المرء أن إحدى السفن تتحرك بسرعة بطريقة لا يمكن تفسيرها، ويصبح من الواضح أنه في حين أن سورا قد يعرف الكثير عن انعكاس الضوء في السوائل، فإنه يعرف القليل أو لا يعرف شيئًا عن القوانين الفيزيائية التي تحكم تحركات السفن الشراعية. .
قيود أخرى: يمكن أن يكون سورا غامضًا بعض الشيء فيما يتعلق بالسبب والنتيجة؛ “قد يأخذ الشخص قضمة من ملف تعريف الارتباط، ولكن بعد ذلك، قد لا يكون هناك علامة قضمة على ملف تعريف الارتباط”. توت توت. قد يؤدي أيضًا إلى “الخلط بين التفاصيل المكانية للموجه، على سبيل المثال الخلط بين اليسار واليمين”. وما إلى ذلك وهلم جرا.
ومع ذلك، فهي مجرد بداية، وستتحسن بلا شك مع مليار تيرافلوب آخر من قوة الحوسبة. وعلى الرغم من أن رؤساء استوديوهات هوليوود يمكنهم الاستمرار في النوم بسهولة في أسرتهم الكبيرة، فإن Sora سيكون قريبًا جيدًا بما يكفي لاستبدال بعض أنواع مقاطع الفيديو المخزنة، تمامًا كما تحل أنظمة الذكاء الاصطناعي مثل Midjourney و Dall-E محل التصوير الفوتوغرافي من نوع Shutterstock.
وعلى الرغم من تنازلاتها بشأن القيود المفروضة على الأداة، إلا أن OpenAI تقول إن Sora “بمثابة أساس للنماذج التي يمكنها فهم العالم الحقيقي ومحاكاته”. وتقول إن هذا سيكون “معلمًا مهمًا” في تحقيق الذكاء العام الاصطناعي (AGI).
وهنا تصبح الأمور مثيرة للاهتمام. تذكر أن هدف شركة OpenAI هو تحقيق الكأس المقدسة للذكاء الاصطناعي العام، ويبدو أن الشركة تعتقد أن الذكاء الاصطناعي التوليدي يمثل خطوة ملموسة نحو هذا الهدف. تكمن المشكلة في أن الوصول إلى الذكاء الاصطناعي العام يعني بناء آلات تتمتع بفهم للعالم الحقيقي على قدم المساواة مع فهمنا على الأقل. ومن بين أمور أخرى، يتطلب ذلك فهمًا لفيزياء الأجسام المتحركة. لذا يبدو أن الرهان الضمني في مشروع OpenAI هو أنه في يوم من الأيام، مع توفر قوة حاسوبية كافية، فإن الآلات القادرة على التنبؤ بكيفية تحرك البكسلات على الشاشة سوف تتعلم أيضًا كيف تتصرف الأشياء المادية التي تصورها في الحياة الحقيقية. بمعنى آخر، إنه رهان على أن استقراء نموذج التعلم الآلي سيوصلنا في النهاية إلى آلات فائقة الذكاء.
لكن أنظمة الذكاء الاصطناعي القادرة على التنقل في العالم الحقيقي ستحتاج إلى فهم أكثر من مجرد فهم كيفية عمل قوانين الفيزياء في ذلك العالم. وسيحتاجون أيضًا إلى معرفة كيفية عمل البشر فيه. وبالنسبة لأي شخص تابع أعمال أليسون جوبنيك، يبدو هذا بمثابة امتداد إلى حد ما لهذا النوع من الآلات التي يعتبرها العالم حاليًا بمثابة “ذكاء اصطناعي”.
تشتهر جوبنيك بأبحاثها حول كيفية تعلم الأطفال. إن مشاهدة محاضرتها في تيد بعنوان “ماذا يفكر الأطفال؟”، ستكون تجربة مفيدة للتقنيين الذين يتخيلون أن التكنولوجيا هي الإجابة على سؤال الذكاء. إن عقودًا من الأبحاث التي استكشفت عملية جمع المعلومات الاستخباراتية المتطورة وصنع القرار الذي يقوم به الأطفال عندما يلعبون، قادتها إلى استنتاج مفاده أن “الرضع والأطفال الصغار يشبهون قسم البحث والتطوير في الجنس البشري”. بعد أن أمضينا عامًا في مراقبة السنة الأولى من تطور حفيدتنا، وعلى وجه الخصوص مراقبة كيف بدأت في اكتشاف العلاقة السببية، يميل كاتب العمود هذا إلى الموافقة على ذلك. إذا كان Sam Altman والرجال في OpenAI مهتمين حقًا بالذكاء الاصطناعي العام، فربما ينبغي عليهم قضاء بعض الوقت مع الأطفال.
ما كنت أقرأ
السياسة الخوارزمية
كتب هنري فاريل مقالًا مؤثرًا عن الاقتصاد السياسي للذكاء الاصطناعي.
عادات البوت
هناك قطعة عاكسة في الأطلسي بقلم ألبرت فوكس كان وبروس شناير حول كيف ستغير روبوتات الدردشة الطريقة التي نتحدث بها.
لا يوجد استدعاء
كتب كاتب الخيال العلمي تشارلي ستروس تدوينة حول سبب عدم قدرة بريطانيا على تطبيق التجنيد الإجباري، حتى لو أرادت ذلك.
اكتشاف المزيد من شبكة الريان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.