مها البلوكي: سخّرت الذكاء الاصطناعي لحفظ التراث الثقافي العربي ومعالجة الأمثال الإماراتية
في الوقت الذي تتزايد فيه أهمية الذكاء الاصطناعي في معالجة اللغات الطبيعية، تبرز الأبحاث التي تهدف إلى الحفاظ على التراث الثقافي، وإثرائه رقمياً. من بين هذه الأبحاث تأتي دراسة الأمثال العربية كموضوع محوري، حيث يتمثل فيها جزء كبير من حكمة الشعوب، وقيمها. في هذه المقابلة، نتعرف إلى الباحثة مها البلوكي، التي اختارت الأمثال الإماراتية لتكون محط اهتمامها في رسالة الماجستير، وهي تسعى لتطوير نماذج وتقنيات جديدة تسهم في الحفاظ على هذا التراث الغني، وتسهيل فهمه باستخدام الذكاء الاصطناعي.
حاورت «كل الأسرة» مها البلوكي كواحدة من الطلبة المتفوقين في برنامج الماجستير في معالجة اللغات الطبيعية، في جامعة محمد بن زايد للذكاء الاصطناعي، وهي تركز في رسالتها على معالجة الأمثال العربية، التي تمثل جزءاً كبيراً من التراث الثقافي الغني، من خلال تصميم نموذج لغوي متقدم، يسهم في الحفاظ على اللغة العربية، وتراثها، مع التركيز بشكل خاص على الأمثال الإماراتية. فقد كرّست مها الكثير جهدها في البحث حول معالجة اللغة العربية باستخدام نموذج «BERT»، (تمثيلات التشفير ثنائية الاتجاه من المحولات)، الذي أطلقته شركة «غوغل» في أكتوبر 2018. ومن خلال هذا النموذج، تمكنت مها من تكييف «BERT» مع اللغة العربية، ما أسهم في تحسين مهام مختلفة، مثل تحليل المشاعر والترجمة الآلية.
ما الذي دفعكِ لاختيار مجال معالجة اللغات الطبيعية، بالتحديد الأمثال العربية، كموضوع لرسالة الماجستير؟
اهتمامي بمجال معالجة اللغات الطبيعية جاء من رغبتي في دعم اللغة العربية رقمياً، وتحليل النصوص التي تمثل جزءاً هامّاً من الثقافة، والتراث. الأمثال العربية، بخاصة الإماراتية، تحتوي على قيم، ومعانٍ عميقة، تنقل الحكمة والخبرات بين الأجيال. لذا اخترت الأمثال كموضوع لرسالتي، لأنها تقدم تحدّياً بحثياً فريداً، وتسهم في الحفاظ على هذا التراث الغني في شكل رقمي حديث.
وما هي الأهداف التي تسعين إلى تحقيقها من خلال هذا البحث؟
أهدافي من البحث تتلخّص في تطوير نظام يستطيع فهم ومعالجة الأمثال الإماراتية، بشكل دقيق، وبناء نموذج يمكنه التمييز بين الاستخدام المجازي والحَرفي، في النصوص العربية، ورقمنة هذه الأمثال لتمكين استخدامها في تطبيقات مختلفة، مثل الترجمة الآلية، وتحليل النصوص الأدبية.
كيف استطعتِ تكييف نموذج «BERT» مع اللغة العربية؟ وما هي التحدّيات التي واجهتكِ في هذه العملية؟
لتكييف نموذج «BERT» مع اللغة العربية، استخدمت نماذج مخصصة، مثل «AraBERT»، وقمت بإعادة تدريبها باستخدام بيانات تحتوي على نصوص عربية متنوّعة، بما في ذلك الأمثال. أما التحدّيات التي واجهتني فكانت في التباين الكبير في اللهجات، واستخدام الكلمات بين مختلف المناطق العربية، ونقص البيانات الممثلة للغة الإماراتية الفصيحة، والمحكية، إضافة إلى صعوبة التعامل مع النصوص القصيرة، والمجردة من السياق، مثل الأمثال.
وكيف أسهم بحثك في تحسين مهام مثل تحليل المشاعر والترجمة الآلية؟
بحثي يسهم في تحسين تحليل النصوص التي تحتوي على معانٍ مجازية، أو تعبيرات تقليدية، وهي جزء صعب في تحليل المشاعر، أو الترجمة الآلية. الأمثال غالباً ما تكون غنية بالتعبيرات التي قد تحمل مشاعر، أو معاني مخفية، وتطوير نموذج يفهم هذه التعبيرات يزيد من دقة التحليل.
كيف ترين دور الذكاء الاصطناعي في الحفاظ على التراث الثقافي العربي، لا سيما الأمثال الإماراتية؟ وما هي الآثار الإيجابية المتوقعة لهذا الدور؟
أعتقد أن الذكاء الاصطناعي يلعب دوراً حيوياً في الحفاظ على التراث من خلال رقمنة المحتوى، وتطوير أدوات يمكنها تفسير النصوص التراثية، وفهمها. على سبيل المثال، رقمنة الأمثال الإماراتية، وتوفيرها كموارد رقمية تسهم في حفظها للأجيال القادمة، وتسهيل دراستها، وفهمها من قِبل المهتمين بالثقافة والتراث.
ما هي أهم التحدّيات التي تواجه أنظمة التعرف البصري إلى الحروف العربية؟
التحدّيات تشمل تنوع الخطوط العربية، وتعقيدها، مقارنة باللغات الأخرى، مشاكل التعرف إلى الأحرف المتصلة ببعضها بعضاً في النصوص، ونقص البيانات المخصصة للتدريب على النصوص المكتوبة بخط اليد.
كيف يمكن الاستفادة من أبحاثك في رقمنة الوثائق العربية والحفاظ عليها؟ وما هي التطبيقات العملية المتوقعة لهذه التقنيات في المستقبل؟
رقمنة الوثائق العربية تساعد على حفظها، وإتاحتها للباحثين والمؤسسات بسهولة. ويمكن استخدام نتائج أبحاثي في بناء أنظمة OCR فعالة تسهم في تحويل الكتب والمخطوطات إلى نصوص رقمية، يمكن البحث فيها بسهولة. والتطبيقات العملية تشمل الأرشفة الرقمية، وتحليل النصوص التاريخية، وحتى إنشاء قواعد بيانات ضخمة للمكتبات الرقمية.
ما هي أهم الإنجازات التي حققتِها في مجال التعرف البصري إلى الحروف العربية؟ وكيف ترين دوركِ كرائدة في هذا المجال؟
حققت تقدماً ملحوظاً في تحسين دقة التعرف إلى الأحرف باستخدام نماذج هجينة، وقدمت نموذجاً يعتمد على بيانات خاصة، بخطوط معيّنة، مثل الخط الديواني وخط الرقعة. وأرى دوري في هذا المجال هو دعم الجهود الرامية إلى رقمنة النصوص العربية، وتمكين اللغة العربية في العصر الرقمي.
هل هناك تعاون بينكِ وبين مؤسسات أخرى في الدولة، أو خارجها لتنفيذ هذه الأبحاث؟
نعم، هناك تعاون مع مؤسسات تعليمية، ومراكز بحثية محلية في الإمارات، مثل مركز حمدان بن محمد لإحياء التراث. كما أسعى للتعاون مع جهات خارجية لتوسيع نطاق البيانات، وتحسين النماذج اللغوية.
ما هي خططك المستقبلية بعد الانتهاء من الماجستير؟ وهل تفكرين في مواصلة دراستك العليا في هذا المجال؟
خطّتي المستقبلية تشمل تطوير أنظمة معالجة اللغة العربية بشكل أعمق، والتركيز على اللهجات المحلية. أفكر في متابعة دراستي للحصول على درجة الدكتوراه في المجال نفسه، والتركيز على تطوير تقنيات جديدة لتحليل النصوص التراثية بشكل أدق.