ترغب بنشر مسار تعليمي؟ اضغط هنا

استخدام المصادر المفتوحة في بناء انطولوجيا باللغة العربية

Using Open Sources for Developing Arabic Ontology

2902   1   79   0 ( 0 )
 تاريخ النشر 2013
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أصبحت القدرة على البحث ضمن مواقع الانترنت ضرورة للكثير من الناس و تعاني كثير من مواقع الانترنت من صعوبة وصول المستخدم للمعلومة المطلوبة بسبب عدم الأخذ بالحسبان معاني الكلمات و مدلولاتها Semantics عند البحث تدعم التقنيات الحالية معظم اللغات الطبيعية مع بقاء ذلك ضعيفاً بالنسبة للغة العربية. تشكل الأنطولوجيا العنصر المحوري في التطبيقات التي تدعم علم دلالات الألفاظ, و على الرغم من وجود الكثير من أدوات بناء الانطولوجيات باللغات الأجنبية، فإن الأداة Arabic WordNet (AWN)، التي تعدّ من المصادر المفتوحة قد تكون الوحيدة التي تسمح لنا بتطوير انطولوجيا باللغة العربية. في هذا البحث سنقوم بتحديد الخطوات اللازمة لتطوير انطولوجيا عربية و بناء انطولوجيا اعتماداً على هذه الخطوات تستخدم في مواقع الجامعات مستخدمين الأداة Arabic WordNet التأكد من نظافة الانطولوجيا المصممة، و تقييم أداء عملية البحث في الموقع بعد استخدام الانطولوجيا المصممة.

المراجع المستخدمة
Taye, M. Ontology Alignment Mechanisms for Improving Web-basedSearching.- United Kingdom,England: De Montfort University, 2009.271 pages
Wilson, R. The Role of Ontologies in Teaching and Learning.-n.p: Ruth Wilson, 2004.16 pages
Kim, H. et al. Implementing an Ontology-Based Knowledge Management System in Korean Financial Firm Environment.-Seoul,Korea:MyongjiUniversity, 2006.10 pages
قيم البحث

اقرأ أيضاً

من أجل مواكبة التقدم الهائل لثورة المعلومات و توفرها على الوب تم وضع طرق و اقتراحات من أجل تحسين فعالية عمليات البحث, معظم هذه الحلول ركزت على خوارزميات ترتيب الصفحات (Page Ranking) و معدل تردد الكلمة (Term Freq. ) و لكن التركيز على استخدام علم دلالا ت الألفاظ و علاقة دلالات الألفاظ مع المحتوى رغم أهميته الكبرى ما زال قليلاً لأسباب مختلفة. يهدف هذا البحث لإيجاد تصميم محرك بحث يعتمد على علم دلالات الألفاظ Semantics) ( يمكن استخدامه للوصول إلى المعلومات ذات الطبيعة غير البنيوية مثل صفحات الوب, و يساعد في تحسين دقة و فعالية عملية البحث. تم إجراء مجموعة من الاختبارات لاستنتاج تصميم محرك البحث و تقييم نتائج استخدام علم دلالات الألفاظ في التعامل مع عمليات البحث على صفحات الوب.
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.
على الرغم من النمو المتزايد في شعبية خدمات الوب، إلاّ أنه لا يزال من الصعب على الزبائن في مجال الأعمال business users الاستفادة الكاملة منها و من البنية SOA لبناء تطبيقاتهم، و ذلك بسبب التوصيف التقني لهذه الخدمات. اقتُرِحت بنية الخدمات الموجهة بالأهد اف iSOA لردم الهوة بين المستوى الأدنى المتعلق بوظائف و توصيف الخدمات البرمجية و بين المستوى الأعلى و هو مستوى الأعمال الذي يُعنى بأهداف العمل. إن تقنيات خدمات الوب الحالية مثل WSDL و UDDI لا تأخذ بعين الاعتبار الأهداف التي قصدها الزبون عند البحث عن خدمة وب، أي لا تتم معالجة مشكلة المطابقة بين وظائف الخدمات البرمجية في المستوى التقني و احتياجات الزبائن (أهدافهم) في مستوى الأعمال. يهتم هذا العمل بتطوير عملية البحث عن خدمات الوب الموجهة بالأهداف باللغة العربية، حيث تم بناء أنطولوجيا للأفعال العربية للمساعدة على تجزئة أهداف الزبون. تتيح هذه التجزئة إمكانية إيجاد خدمات وب مفيدة للزبون لم يكن بمقدوره الوصول إليها باستخدام التوسعة الدلالية فقط. تم في هذا العمل بناء مثال عملي للتحقق من كيفية استخدام أنطولوجيا الأفعال العربية في البحث عن خدمات الوب.
اكتسب نمذجة اللغة الطبيعية الكثير من الاهتمام مؤخرا.يتم تحقيق النتائج الحالية الحالية من خلال التدريب الأول نموذج لغة كبير جدا ثم قم بضبطه على مهام متعددة.ومع ذلك، هناك القليل من العمل على أحدث نماذج لغة أكثر إحكاما للأجهزة أو التطبيقات المحدودة للمو رد.ناهيك عن، وكيفية تدريب هذه النماذج بكفاءة لغوية منخفضة الموارد مثل اللغة العربية.في هذه الورقة، نحقق في كيفية تدريب هذه النماذج بطريقة مدمجة للعربية.نوضح أيضا كيف يمكن تطبيق التقطير والتجميل لإنشاء نماذج أصغر.تبين تجاربنا أن أكبر نموذج لدينا هو 2x أصغر من خط الأساس يمكن أن يحقق نتائج أفضل على مهام متعددة مع بيانات أقل بنسبة 2X لإحاطاء.
نعرض في هذا البحث المنهجية المعتمدة في بناء منصة ArOntoLearn, و هي بيئة عمل تساعد على بناء أنطولوجية عربية اعتماداً على النصوص في الوب، و أهم سمات هذه البيئة أنها تدعم اللغة العربية و تستخدم المعرفة السابقة في إجرائيات التعلم، فضلاً عن أنها تمثل الأن طولوجية الناتجة باستخدام نموذج الأنطولوجية الاحتمالي (Probabilistic Ontology Model (POM الذي يمكن ترجمته إلى أي صيغة تمثيل للمعرفة. يقوم النظام بتحليل الموارد النصية العربية، يقابلها مع نماذج مفرادتية-نحوية بهدف تعّلم مفاهيم و علاقات جديدة. إن دعم اللغة العربية ليس سهلاً نظراً لكون أدوات المعالجة اللغوية المتوافرة غير فعالة كفاية لمعالجة النصوص العربية غير المشكولة التي كذلك نادراً ما تتضمن علامات الترقيم الصحيحة المساعدة على التحليل الصحيح للجمل. لذلك حاولنا بناء بيئة عمل مرنة يمكن إعدادها بسهولة بحيث تُعدلُ أدوات التحليل المستخدمة فيها و تُستَبدلُ بأخرى أكثر تطوراً عند توافرها.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا