ترغب بنشر مسار تعليمي؟ اضغط هنا

يعد غياب التشكيل في النصوص العربية الحديثة من أكبر التحديات التي تواجه المعالجة الآلية للغة العربية. يمكن للقارئ العربي أن يتوقع التشكيل الصحيح للكلمات عند قراءته نصاً غير مشكول، في حين يحتاج الحاسوب إلى خوارزميات لاستعادة التشكيل بالاعتماد على معار ف مختلفة. و نقصد بالتشكيل الحركات جميعها (ضمة، فتحة، كسرة، سكون)، فضلاً عن الشدة و التنوين. تعتمد بعض منهجيات التشكيل الآلي على المعالجة اللغوية للنصوص، في حين تعتمد منهجيات أخرى على طرائق إحصائية تستند إلى المدونات، و تدمج بعض النظم المنهجيتين السابقتين في مقاربات هجينة. نعرض في هذا البحث دراسة مرجعية شاملة للطرائق المختلفة التي اعتُمدت في هذه المنهجيات، كما نستعرض المدونات المختلفة التي استُخدمت للاختبارات و التقويم، ثم نطرح مواصفات المدونات التي يجب إعدادها لإجرائيات التقويم، و المعايير التي يجب أن تحققها إجرائية تقويم المشكلات الآلية. يخلص البحث إلى وضع خطة عمل لبناء مشكل آلي مفتوح المصدر برعاية منظمة ألكسو، و بمشاركة جهات بحثية من بلدان مختلفة.
نعرض في هذا البحث المنهجية المعتمدة في بناء منصة ArOntoLearn, و هي بيئة عمل تساعد على بناء أنطولوجية عربية اعتماداً على النصوص في الوب، و أهم سمات هذه البيئة أنها تدعم اللغة العربية و تستخدم المعرفة السابقة في إجرائيات التعلم، فضلاً عن أنها تمثل الأن طولوجية الناتجة باستخدام نموذج الأنطولوجية الاحتمالي (Probabilistic Ontology Model (POM الذي يمكن ترجمته إلى أي صيغة تمثيل للمعرفة. يقوم النظام بتحليل الموارد النصية العربية، يقابلها مع نماذج مفرادتية-نحوية بهدف تعّلم مفاهيم و علاقات جديدة. إن دعم اللغة العربية ليس سهلاً نظراً لكون أدوات المعالجة اللغوية المتوافرة غير فعالة كفاية لمعالجة النصوص العربية غير المشكولة التي كذلك نادراً ما تتضمن علامات الترقيم الصحيحة المساعدة على التحليل الصحيح للجمل. لذلك حاولنا بناء بيئة عمل مرنة يمكن إعدادها بسهولة بحيث تُعدلُ أدوات التحليل المستخدمة فيها و تُستَبدلُ بأخرى أكثر تطوراً عند توافرها.
نعرض في هذه الورقة نظام معجم اللغة العربية الحاسوبي المطور في المعهد العالي للعلوم التطبيقية و التكنولوجيا. يتيح هذا النظام للمستخدِم البحث عبر الوب عن معاني المفردات، و يعرض خصائص كلِّ معنى، مع عددٍ من الأمثلةِ و بعض الوسائط المتعددة الموافقة، فضلاً عن معلومات أخرى تتعلَّق بالمفردة (كالكلمات المصاحبة، و المجالات الدلالية، و العبارات الاصطلاحية، و الفوائد اللغوية و الصرفية و النحوية و البلاغية، و الأخطاء الشائعة). كذلك يتيح المعجم للمستخدم الخبير المشاركة في عملية إغناء المعجم بالمفردات التي لم ترد ضمنه و المعاني الأخرى لمداخله الحالية و ما يتصل بهما من معلومات على المستويات الصرفية و النحوية و الدلالية.
يعد التحليل الصرفي خطوة مهمة من خطوات المعالجة الآلية للغات الطبيعية و تطبيقاتها المتنوعة، و يحتاج كل نوع من هذه التطبيقات إلى درجةٍ مختلفة من التوازن بين الأداء و الوثوقية و شمولية النتائج ( إيجاد جميع الحلول المحتملة )؛ ففي حين تهتم بعض التطبيقات ب الوثوقية العالية للنتائج، تهتم تطبيقات أخرى بالمحافظة على أداءٍ فعالٍ للنظام، و تُعنى تطبيقات أخرى بأنظمة تحليلٍ صرفيٍ تنتج كل الحلول الممكنة و بوثوقية عالية. نقدم في هذا المقال وصفاً موجزاً لمنهجية جديدة لبناء نظام تحليل صرفي للغة العربية يتمتَّع بالمرونة، و يمكن إعداده بحيث يلائم التطبيق الهدف. و قد بينت الاختبارات أن النظام المنجز يحقق مرونة تجعل منه مناسباً للاستخدام في معظم أنواع التطبيقات على اختلاف متطلباتها. كذلك، يتضمن النظام مكوناً مستقلاً يمكن إضافته بسهولة إلى أنظمة التحليل الصرفي الأخرى لتحسين أدائها دون أية آثار سلبية على الدقة أو شمولية النتائج.
يعد هذا البحث مرحلة من مراحل بناء نظام تركيب الكلام باللغة العربية، و هي مرحلة تحويل النصوص العربية من رموز كتابية إلى رموز صوتية. جرى في هذه المرحلة بناء نظام متكامل خاص باللغة العربية لإجراء التحويل. اعتمد نظام التحويل من رموز كتابية إلى رموز صو تية أساسًا على بنية النظام Orthographic-Phonetic ) TOPH (Transcription الذي يقوم بتحويل الرموز الكتابية إلى رموز صوتية باللغة الفرنسية، و الذي يعتمد مبدأ استخدام القواعد في ذلك.
نقدم في هذا البحث مركب كلام للغة العربية ذا جودة عالية، باستعمال طريقة الضم لأنصاف المقاطع الصوتية. يتألف العمل من سبع مراحل أساسية: بناء القاموس الصوتي لأنصاف المقاطع الصوتية، بناء مكون معالجة اللغة الطبيعية الذي يتكون من وحدة المعالجة المسبقة للن ص واستعمال نظام خبير لتحويل النص المشكول إلى مقابله الصوتي، بناء نظام خبير يعتمد على القواعد لتقطيع سلسلة الصوتيمات لكل من الكلمات و العبارات في الجمل إلى مقاطعها الصوتية و إسناد واصفات كل مقطع وفق خوارزمية خاصة باللغة العربية، دراسة تحليلية صوتية للنبر في الحديث المتواصل لاستخراج أثر المقاطع المنبورة على موسطات التنغيم على مستوى الكلمات و العبارات.
نقترح في هذه الأطروحة منهجية لتوليد مخططات الإجراءات من النصوص تحاكي عملية الترجمة الآلية, حيث تعتمد المنهجية المقترحة أسلوب الترجمة بالنقل على أساس دلالي, حيث ستتم في المرحلة الأولى معالجة النص لاستخلاص المفاهيم الأساسية فيه و العلاقات الدلالية بين هذه المفاهيم بما يشكل شبكة مفاهيم concept map للنص .
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا