OpenAI تعمل على تطوير أداة تمكن المبدعين من التحكم بشكل أفضل في استخدام محتواهم في تدريب الذكاء الاصطناعي الإنشائي. يطلق على هذه الأداة اسم “مدير الوسائط”، وهي تسمح للمبدعين وأصحاب المحتوى بتحديد أعمالهم وتحديد ما إذا كانوا يرغبون في تضمينها أو استبعادها من التدريب.
الهدف هو أن يكون هذا الأداة جاهزًا بحلول عام 2025، وفقًا لما أعلنته OpenAI، حيث تعمل الشركة مع المبدعين وأصحاب المحتوى والجهات التنظيمية نحو وضع معيار قياسي، ربما من خلال اللجنة التوجيهية في الصناعة التي انضمت إليها مؤخرًا.
تقول OpenAI في منشور على مدونتها: “سنحتاج إلى البحث في مجال التعلم الآلي المتقدم لبناء أداة فريدة من نوعها لمساعدتنا في تحديد النصوص والصور والصوت ومقاطع الفيديو المحمية بحقوق الطبع والنشر من مصادر متعددة وتعكس تفضيلات المبدعين. مع مرور الوقت، نعتزم إضافة مزيد من الخيارات والميزات.”
مدير الوسائط يأتي كاستجابة من OpenAI لانتقادات متزايدة تتعلق بطريقتها في تطوير الذكاء الاصطناعي، حيث يعتمد ذلك بشكل كبير على جمع البيانات العامة من الويب. وفي الآونة الأخيرة، رفع ثمانية صحفيين بارزين في الولايات المتحدة دعوى قضائية ضد OpenAI بتهمة انتهاك الملكية الفكرية، حيث اتهموا OpenAI بسرقة المقالات لتدريب نماذج الذكاء الاصطناعي وتسويقها دون تعويض أو إعطاء الإشارة للمنشورات المصدر.
تعتمد نماذج الذكاء الاصطناعي الإنشائي، بما في ذلك تلك التي تقدمها OpenAI، على عدد هائل من الأمثلة المأخوذة عادةً من مواقع الويب العامة ومجموعات البيانات. تُجادل OpenAI وموردي الذكاء الاصطناعي الإنشائي الآخرون بأن مبدأ الاستخدام العادل يحمي ممارساتهم في جمع البيانات العامة واستخدامها لتدريب النماذج. ولكن ليس الجميع متفقًا على ذلك.
في الواقع، أشارت OpenAI مؤخرًا إلى أنه من المستحيل إنشاء نماذج ذكاء اصطناعي مفيدة بدون استخدام مواد محمية بحقوق الطبع والنشر.
ومع ذلك، في جهود لتهدئة النقاد والدفاع عن نفسها ضد الدعاوى القضائية المستقبلية، اتخذت OpenAI خطوات لتلبية مطالب مبدعي المحتوى.
فقد سمحت OpenAI العام الماضي للفنانين بـ “الانسحاب” وإزالة أعمالهم من مجموعات البيانات التي تستخدمها الشركة لتدريب نماذجها لتوليد الصور. بالإضافة إلى ذلك، تتيح الشركة لأصحاب المواقع تحديد ما إذا كان يمكن كتابة محتوى موقعهم لتدريب نماذج الذكاء الاصطناعي عن طريق معيار robots.txt، الذي يعطي تعليمات حول المواقع لروبوتات الويب. وتواصل OpenAI توقيع صفقات ترخيص مع أصحاب محتوى كبار، بما في ذلك منظمات الأخبار ومكتبات وسائط الأسهم ومواقع الأسئلة والأجوبة مثل Stack Overflow.
ومع ذلك، يعتبر بعض مبدعي المحتوى أن OpenAI لم تذهب بعيداً بما فيه الكفاية.
فقد وصف الفنانون عملية “الانسحاب” الخاصة بصور OpenAI، التي تتطلب تقديم نسخة فردية من كل صورة لإزالتها مع وصف، كثقيلة. ويبدو أن OpenAI تدفع مبالغ مالية نسبيًا قليلة لترخيص المحتوى. كما تعترف OpenAI ذاتها في منشور المدونة يوم الثلاثاء، فإن الحلول الحالية للشركة لا تعالج سيناريوهات تتم فيها استشهاد أعمال المبدعين أو إعادة تصميمها أو نشرها على منصات لا يتحكمون فيها.
وبالإضافة إلى OpenAI، هناك عدد من الأطراف الثالثة التي تحاول بناء أدوات مصدر والانسحاب العالمية للذكاء الاصطناعي الإنشائي.
فتقدم شركة الناشئة Spawning AI، التي تتعاون مع Stability AI و Hugging Face، تطبيقًا يحدد ويتتبع عناوين IP لمنع محاولات الكتابة، بالإضافة إلى قاعدة بيانات يمكن للفنانين تسجيل أعمالهم لمنع التدريب من قبل البائعين الذين يختارون احترام الطلبات. وتساعد Steg.AI و Imatag المبدعين في تحديد ملكيتهم للصور من خلال تطبيق علامات مائية لا يمكن اكتشافها بالعين المجردة. و Nightshade، وهو مشروع من جامعة شيكاغو، يقوم بـ “تسميم” بيانات الصور لجعلها غير مفيدة أو مضادة لتدريب نماذج الذكاء الاصطناعي.
الخلاصة
مقالة تتحدث عن جهود OpenAI في تطوير أداة تسمى “مدير الوسائط”، التي تسمح للمبدعين بالتحكم في استخدام محتواهم في تدريب الذكاء الاصطناعي. الهدف هو إطلاق الأداة بحلول عام 2025، وذلك بالتعاون مع المبدعين والجهات التنظيمية. تقدم المقالة نقدًا لنهج OpenAI في استخدام البيانات العامة لتدريب الذكاء الاصطناعي، مع ذكر حالات قانونية ومبادرات للحماية تشمل “الانسحاب” من المبدعين وصفقات ترخيص المحتوى. كما يتم ذكر جهود أخرى من الأطراف الثالثة لبناء أدوات تساعد في تحديد الملكية والحفاظ عليها.