Subjects
-Abstract
يهدف البحث إلى تقييم وتقويم أداة قياس تشابه الجمل (Sentence similarity) الملحقة بـ(BERT) المعدة من (Google)، التي يعتمد عليها بشكل كبير في البحوث المهتمة بمعالجة اللُّغات الطَّبيعيَّة، خاصة في تحسين مخرجات التَّرجمة الآليَّة[ ]، وذلك من خلال تتبع دقة مخرجاتها ودراسة تلك المخرجات، ثم ترجمة النتائج إلى إحصاءات توضح مدى دقة تعامل هذه الأداة المهمة مع اللُّغة.
وللوصول للهدف المنشود من البحث، تم الاعتماد على مدونة متوازية بين اللغة العربية واللغة الإنجليزية، ثم ترجمة عينة عشوائية من المدونة باللغة الإنجليزية على (Google Translate)[ ]، ثم محاذاة نتائج الترجمة مع المدونة باللغة العربية، ثم إدخال أزواج الجمل المتحاذية (Patterns) باللغة العربية إلى (BERT)؛ لقياس مدى التشابه الدلالي بينها من خلال الأداة (Sentence similarity).
وأمكن البحثُ من خلال التطبيق العملي وتحليل مخرجات (BERT)، التوصل إلى مواضع الخلل التي تعيق عمل الأداة مع اللغة العربية، مقارنًا تلك النتائج بتعامل الأداة نفسها مع اللغة الإنجليزية، وكانت النتيجة في صالح اللغة الإنجليزية؛ حيث بلغت نسبة كفاءة الأداة معها حوالي (65%)، في مقابل (40%) مع اللُّغة العربيَّة.
وقد وضع البحث مقترحًا يسهم إلى تحسين مخرجات تعامل (BERT) مع اللغة العربية، مستندًا في ذلك على نتائج تحليل عينة الدراسة، والوقوف على أبرز الأخطاء التي لم تستطع الأداة تخطيها، مما قلل من كفاءتها.
DOI
10.21608/mjoms.2023.250586.1134
Keywords
Bert, التَّشابه الدِّلاليِّ بين النُّصوص, معالجة اللُّغات الطَّبيعيَّة, المدونات اللغوية, التَّرجمة الآليَّة
Authors
Last Name
مَجدي لَبيب حامِد
MiddleName
-Affiliation
المتطلبات الجامعية – جامعة مصر للعلوم والتکنولوجيا.
Email
mohamed.labib@must.edu.eg
Orcid
-Link
https://mjoms.journals.ekb.eg/article_328546.html
Detail API
https://mjoms.journals.ekb.eg/service?article_code=328546
Publication Title
مجلة جامعة مصر للدراسات الإنسانية
Publication Link
https://mjoms.journals.ekb.eg/
MainTitle
التَّشابُهُ الدِّلاليُّ بَيْنَ الجملِ العربيَّةِ من خلالِ تِقْنِيةِ (BERT بيرت) الإلكترونيَّة: دراسة تقييميَّة حاسوبيَّة