تعتبر OpenAI أداة استنساخ الصوت الخاصة بها محفوفة بالمخاطر للغاية بالنسبة للإصدار العام | OpenAI


تم اعتبار أداة جديدة من OpenAI يمكنها إنشاء نسخة مقنعة لصوت أي شخص باستخدام 15 ثانية فقط من الصوت المسجل أنها محفوفة بالمخاطر للغاية بحيث لا يمكن إصدارها بشكل عام، حيث يسعى مختبر الذكاء الاصطناعي إلى تقليل خطر المعلومات الخاطئة الضارة في عام الانتخابات العالمي.

تم تطوير Voice Engine لأول مرة في عام 2022 وتم استخدام إصدار أولي لميزة تحويل النص إلى كلام المضمنة في ChatGPT، أداة الذكاء الاصطناعي الرائدة في المؤسسة. لكن قوتها لم يتم الكشف عنها علنًا قط، ويرجع ذلك جزئيًا إلى النهج “الحذر والمستنير” الذي تتبعه شركة OpenAI لإطلاقها على نطاق أوسع.

وقالت OpenAI في تدوينة غير موقعة: “نأمل أن نبدأ حوارًا حول النشر المسؤول للأصوات الاصطناعية، وكيف يمكن للمجتمع أن يتكيف مع هذه القدرات الجديدة”. “استنادًا إلى هذه المحادثات ونتائج هذه الاختبارات صغيرة النطاق، سنتخذ قرارًا أكثر استنارة حول ما إذا كان سيتم نشر هذه التكنولوجيا على نطاق واسع وكيفية ذلك.”

شاركت الشركة في منشورها أمثلة على الاستخدامات الواقعية للتكنولوجيا من مختلف الشركاء الذين تم منحهم إمكانية الوصول إليها لبناء تطبيقاتهم ومنتجاتهم.

وتستخدمه شركة تكنولوجيا التعليم Age of Learning لإنشاء تعليقات صوتية مكتوبة، في حين يوفر تطبيق “السرد القصصي المرئي بالذكاء الاصطناعي” HeyGen للمستخدمين القدرة على إنشاء ترجمات للمحتوى المسجل بطريقة بطلاقة ولكنها تحافظ على لهجة وصوت المتحدث الأصلي. على سبيل المثال، يؤدي إنشاء اللغة الإنجليزية باستخدام عينة صوتية من متحدث فرنسي إلى إنتاج خطاب بلكنة فرنسية.

والجدير بالذكر أن الباحثين في معهد نورمان برينس لعلوم الأعصاب في رود آيلاند استخدموا مقطعًا رديئًا مدته 15 ثانية لامرأة شابة تقدم عرضًا تقديميًا في مشروع مدرسي من أجل “استعادة الصوت” الذي فقدته بسبب ورم في الدماغ الوعائي.

قال OpenAI: “نحن نختار معاينة هذه التكنولوجيا ولكن لا ننشرها على نطاق واسع في هذا الوقت”، من أجل “تعزيز مرونة المجتمع في مواجهة التحديات التي تفرضها النماذج التوليدية الأكثر إقناعًا من أي وقت مضى”. وفي المستقبل القريب، قالت: “نحن نشجع خطوات مثل الإلغاء التدريجي للمصادقة الصوتية كإجراء أمني للوصول إلى الحسابات المصرفية وغيرها من المعلومات الحساسة”.

كما دعت OpenAI أيضًا إلى استكشاف “سياسات لحماية استخدام أصوات الأفراد في الذكاء الاصطناعي” و”تثقيف الجمهور في فهم قدرات وقيود تقنيات الذكاء الاصطناعي، بما في ذلك إمكانية محتوى الذكاء الاصطناعي المخادع”.

وقالت OpenAI إن أجيال محرك الصوت تحمل علامة مائية، مما يسمح للمنظمة بتتبع أصل أي صوت تم إنشاؤه. وأضافت: “في الوقت الحالي، تتطلب شروطنا مع هؤلاء الشركاء موافقة صريحة ومستنيرة من المتحدث الأصلي، ولا نسمح للمطورين ببناء طرق للمستخدمين الفرديين لإنشاء أصواتهم الخاصة”.

ولكن في حين تتميز أداة OpenAI بالبساطة التقنية والكمية الضئيلة من الصوت الأصلي المطلوب لإنشاء نسخة مقنعة، فإن المنافسين متاحون بالفعل للجمهور.

من خلال “بضع دقائق فقط من الصوت”، يمكن لشركات مثل ElevenLabs إنشاء نسخة صوتية كاملة. وفي محاولة للتخفيف من الأضرار، قدمت الشركة حماية “الأصوات المحظورة”، المصممة لكشف ومنع إنشاء نسخ صوتية “تحاكي المرشحين السياسيين المشاركين بنشاط في الانتخابات الرئاسية أو انتخابات رئاسة الوزراء، بدءاً بالمرشحين في الولايات المتحدة وأوروبا”. المملكة المتحدة”.


اكتشاف المزيد من شبكة الريان

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من شبكة الريان

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading