الجمعة, 3 مايو 2024

OpenAI تقدم للناشرين مليون دولار سنويًا لهذا السبب

FacebookTwitterWhatsAppTelegram

بدأت الأسعار التي ترغب شركات، مثل OpenAI، دفعها مقابل الحصول على معلومات محمية بحقوق التأليف تظهر مع إبرام ناشري الأخبار صفقات مع شركات الذكاء الاصطناعي لتدريب النماذج على القصص الإخبارية.

ويشير تقرير جديد إلى أن OpenAI تقدم مبالغ تتفاوت بين مليون دولار وخمسة ملايين دولار سنويًا لترخيص المقالات الإخبارية المحمية بحقوق التأليف لتدريب نماذجها للذكاء الاصطناعي، حسبما تناولته “البوابة العربية للتقنية”.

وتعد هذه الأرقام بمنزلة المؤشرات الأولى على المبالغ التي تخطط شركات الذكاء الاصطناعي لدفعها مقابل المواد المرخصة.

اقرأ المزيد

وتظهر هذه الأرقام بالتزامن مع تقرير حديث يشير إلى أن آبل تتطلع إلى الشراكة مع شركات الإعلام لاستخدام المحتوى لتدريب الذكاء الاصطناعي وتقدم نحو 50 مليون دولار على مدى عدة سنوات للبيانات.

وتبدو الأرقام مشابهة تقريبًا لبعض صفقات الترخيص السابقة غير المتعلقة بالذكاء الاصطناعي.

وأشارت التقارير السابقة إلى أن ميتا عرضت نحو 3 ملايين دولار سنويًا لترخيص القصص الإخبارية والعناوين الرئيسية والمعاينات عندما أطلقت علامة التبويب Facebook News.

وليس من الواضح إذا كان إجمالي مدفوعات OpenAI قد يعادل بعض الأرقام الكبيرة التي ظهرت سابقًا، إذ أعلنت جوجل في عام 2020 أنها تستثمر مليار دولار إجمالًا للدخول في شراكة مع المؤسسات الإخبارية.

ووافقت جوجل سابقًا تحت ضغط من قانون جديد على دفع نحو 100 مليون دولار سنويًا للناشرين الكنديين مقابل ربط مقالاتهم.

وتستخدم النماذج اللغوية الكبيرة المعلومات الواردة من الإنترنت للتدريب، ولا تكشف بعض نماذج الذكاء الاصطناعي عن كيفية حصولها على بيانات التدريب، مع أن المعلومات غالبًا ما تكون متاحة من خلال مجموعات البيانات أو زواحف الويب.

ويختلف سعر مجموعات بيانات التدريب حسب الموفر والحجم ومحتوى مجموعة البيانات.

ويطور مطورو الذكاء الاصطناعي زواحف الويب التي تجمع البيانات عبر الإنترنت من أجل المساعدة في تدريب النماذج اللغوية الكبيرة، ويوظفون أشخاصًا لفحص بيانات التدريب ووضع علامات عليها وفي بعض الأحيان تنظيفها، وهو ما يزيد بشكل كبير من تكاليف التشغيل.

وتواجه هذه الممارسة الآن تحديات كبيرة، إذ منعت بعض الشركات وصول زاحف الويب GPT الذي طورته OpenAI إلى البيانات، مثل نيويورك تايمز وفوكس ميديا.

وترى العديد من المنظمات أن التدريب على بياناتها يشكل انتهاكًا لحقوق التأليف، وقد رفعت صحيفة نيويورك تايمز دعوى قضائية على OpenAI ومايكروسوفت بسبب انتهاك حقوق التأليف، زاعمة أن ChatGPT و Copilot يمكنهما توليد مخرجات حرفية تقريبًا لعملها.

وتتيح الشراكات لشركات الذكاء الاصطناعي تجنب هذه المشكلات، وقد أصبحت هذه الصفقات شائعة خلال العام الماضي، إذ وقع ناشرون صفقات مع OpenAI لترخيص القصص لتدريب النماذج وتطوير التكنولوجيا لجمع الأخبار، مثل وكالة أسوشيتد برس.

ذات صلة

المزيد