الناشر: شركة مال الإعلامية الدولية
ترخيص: 465734
تعمل تقنيات الذكاء الاصطناعي على تحسين أداء المؤسسات وإنتاجيتها عن طريق أتمتة العمليات أو المهام التي كانت تتطلب القوة البشرية فيما مضى، ومن أمثلة الذكاء الاصطناعي هو الروبوتات و الدرونز وكذلك الأنظمة الذكية التي يمكنها أن تتعلم ذاتيا بعد تغذيتها بكميات كبيرة من البيانات، ومن ثم تتمكن تلك الأنظمة الذكية من التنبؤ المستقبلي بأداء المؤشرات المختلفة، وذلك يوفر الوقت والجهد والمال، ومن هنا تظهر أهمية تبني الذكاء الاصطناعي في تعزيز الاقتصاد الرقمي.
وتعمل المملكة على جذب استثمارات في مجال البيانات والذكاء الاصطناعي بقيمة 80 مليار ريال حتى عام 2030.
وبشكل عام، تم تقدير استثمارات الحكومة والقطاع الخاص في تقنية المعلومات والاتصالات ب 15 مليار دولار منذ عام 2017. كما أنه، وحتى اليوم، بلغت مساهمة الاقتصاد الرقمي في المملكة حوالي 400 مليار ريال بنسبة تراوحت بين 13 و14 في المائة في الناتج المحلي، وتستهدف المملكة رفع النسبة خلال الأعوام القادمة إلى أكثر من 19 في المائة.
ومعالجة اللغات الطبيعيةNLP Natural Language Processing أو ما يُسمى أحيانا بتقنيات اللغة، هو فرع من الذكاء الاصطناعي يُركز على تحليل وفهم ونمذجة اللغات البشرية الطبيعية كالعربية والفرنسية وغيرها من اللغات، وكمثال لها تطبيقات الترجمة، ومحركات البحث في الانترنت، وكذلك استخدام تطبيقات المساعدة الصوتية في الهواتف المحمولة مثل سيري واليكسا وكورتانا.
ولأن معالجة اللغات الطبيعية هو فرعا من الذكاء الاصطناعي، فإن الأساليب الأكثر استخداما فيه اليوم هي أساليب التعلم الآلي العميق والإحصائي والتي تعتمد بشدة على موارد البيانات.
(وتوجد العديد من التحديات التي تواجهها اللغة العربية تقنيا)
و كأمثلة لتلك التحديات، هو ان لغات البرمجة المستخدمة عالمياً مثل لغة البايثون وجافا وغيرها من البرمجيات، تعتمد على اللغة الإنجليزية بشكل أساسي، ولا يوجد توطين للغات البرمجة إلى لغات أخرى باستثناء بعض المحاولات المحدودة في الصين وكوريا لتوطين لغاتهم أثناء البرمجة، إلا أن اللغة الانجليزية تبقى الأساس للمبرمجين حول العالم، منذ أن بدأت تقنيات الحاسب والبرمجيات بلغة Assembly في الولايات المتحدة في عام 1949م.
وأيضاً، من التحديات هو عدم وجود موارد بيانات كافية للغة العربية ولهجاتها المتعددة. فمثلا، لبناء نظام ترجمة آلي بين لغتين يلزمنا الآلاف بل حتى الملايين من الجمل المترجمة في اللغتين “أو ما يسمى بالمدونات المتوازية”. وهذه الجمل تشكل نماذج حاسوبية للترجمة تستفيد منها خوارزميات التعلم الآلي.
ويبلغ عدد الدول العربية تقريبا 22 دولة، ورغم أن جميع تلك الدول تتحدث العربية كلغة رسمية، إلا أنه يوجد بها أكثر من 50 لهجة مختلفة.
كما أننا نجد ان لغة الإنسان العربي اليومية، بشكل عام، قد يتخللها استخدام بعض المفردات العامية وبعض المفردات الفصحى وكذلك قد يتخللها مفردات مُعربة من لغات أخرى كالإنكليزية والفرنسية. وبالتالي، عدم وجود معايير إملاء قياسي للعامية.
وبالرغم من وجود كمية كافية من موارد البيانات بالفصحى، في نطاق الأخبار أو القرارات السياسي، لتحقيق جودة عالية، إلا أن كمية الموارد قليلة في نطاقات أخرى كاللغة الأدبية أو في اللهجات العامية.
وبالطبع، فإن جودة النتائج المخرجة من قبل خوارزميات الذكاء الاصطناعي تتأثر لأنها تعتمد على كمية البيانات المتوفرة. وعلى الرغم من أن الخوارزميات المستخدمة في معالجة اللغات الطبيعية هي خوارزميات حيادية لغويا، إلا أننا نجد أن جودة التطبيقات في لغات معينة كالإنكليزية والألمانية أعلى من العربية لكون تلك اللغات غنية بموارد البيانات.
وأيضاً من التحديات التقنية في تطوير تطبيقات ذكية للغة العربية، هو كثرة الأخطاء الإملائية في اللهجة الفصحى كما نجدها اليوم على مواقع التواصل الاجتماعي، وعلوم النحو والصرف الغنية جدا للغة العربية، وكذلك التشكيل وما ينتج عنه من إملاء مبهم أحيانا إذا لم يُستخدم أثناء الكتابة.
وهذه التحديات بدورها تضعف جودة أنظمة الذكاء الاصطناعي وتجعل تقييمها صعبا أو شبه مستحيل، حيث لا يوجد اتفاق على النتيجة الصحيحة المطلوبة لبرامج التعرف الآلي على الكلام، سواءاً المسموع أو المكتوب، مثلا.
وهناك حاليا تحدي آخر، وهو الاهتمام الكبير بين متخصصي الذكاء الاصطناعي بتطوير أنظمة ذكية غير عنصرية أو تمييزية. فمثلا عند ترجمة عبارتي” I am a doctor” و”I am a nurse” إلى العربية باستخدام مترجم غوغل نحصل على “أنا طبيب” و”أنا ممرضة”، ولا نحصل على الترجمة “أنا طبيبة” أو “أنا ممرض”.
(جهود محلية ودولية لإيجاد حلول)
في صيف عام 2019، عُقد أحد أكبر مؤتمرات معالجة اللغات الطبيعية في فلورنسا، إيطاليا، وبلغ عدد الحضور حوالي 3,700 شخص كان من بينهم 27 عربياً. وسوف يزداد عدد المهتمين بهذا المجال مستقبلاً نظراً لازدياد دعم البحث العلمي في مجال الذكاء الاصطناعي في العالم العربي، خلال السنوات القليلة الماضية.
كما أنه يوجد حالياً، وبشكل مبدئي، أربعة موارد بيانات للغة العربية. تم تطوير اثنان منها في الولايات المتحدة، وتطوير المورد الثالث في المملكة المتحدة والرابع في جمهورية التشيك. وتُعد هذه الموارد هامة للبحث العلمي ولتطوير تطبيقات الذكاء الاصطناعي اللغوي.
وأحد الجهود الكبيرة كذلك هو إنشاء “مركز الذكاء الاصطناعي في معالجة اللغة العربية” وهو أحد مشاريع “مجمع الملك سلمان العالمي للغة العربية”. وتأسس مجْمع الملك سلمان بموجب قرار لمجلس الوزراء بتاريخ ١ سبتمبر 2020م، للمساهمة في تعزيز دور اللغة العربية إقليمياً وعالمياً، وإبراز قيمتها وعمقها اللغوي. كما يهتم المركز بالبحث في اللغة العربية باستخدام تقنيات الذكاء الاصطناعي، من خلال تطوير الأدوات العلمية والبحثية والتطبيقات الحاسوبية التي تسهم في تسهيل التعامل مع اللغة من قبل الحاسب، وفي الحضور اللغوي على المنصات والتطبيقات الحاسوبية.
كما يهدف المركز إلى دعم الباحثين والخبراء والطلاب في مجال حوسبة اللغة العربية من خلال الاستقطاب والشراكات والمنح وغيرها، ليكون مرجعاً في مجال تخصصه البحثي للمستفيدين من مخرجاته سواء أكانوا أفرادًا أم جهات.
ويوفر المركز مجموعة من الخدمات للباحثين تشمل: أدوات الذكاء الاصطناعي في معالجة اللغة العربية، وتطبيقات مساعدة في بناء وتهيئة البيانات اللغوية، ومدونات ومعاجم ومصادر متنوعة في اللغة العربية.
وتشمل مجالات واهتمامات المركز المصادر والمعايير اللغوية،ومدونات لغوية متخصصة وعامة (مكتوبة، صوتية)، تمثل فترات زمنية ومناطق جغرافية متنوعة، وكذلك معاجم لغوية عامة ومتخصصة، بالإضافة إلى هيكلية وحوكمة البيانات اللغوية ومعاييرها ونماذج وسم تلك البيانات، واستخدام الأدوات الحاسوبية اللغوية كالتحليل والتلخيص الآلي والترجمة الآلية وغيرها من الأدوات التقنية المطلوبة في عصر التحول الرقمي الذي نعيشه حالياً.
الناشر: شركة مال الإعلامية الدولية
ترخيص: 465734
©2025 جميع الحقوق محفوظة وتخضع لشروط الاتفاق والاستخدام لصحيفة مال