ترغب بنشر مسار تعليمي؟ اضغط هنا

تحتل الدراسات التي تتناول حوسبة اللغة العربية أهمية كبيرة نظراً للانتشار الواسع للغة العربية , و اخترنا في هذه الدراسة العمل على معالجة اللغة العربية من خلال نظام استرجاع معلومات للمستندات باللغة العربية , الفكرة الأساسية لهذا النظام هو تحليل المستن دات والنصوص العربية و إنشاء فهارس للمصطلحات الواردة فيها , ومن ثم استخلاص أشعة أوزان تعبر عن هذه المستندات من أجل المعالجة اللاحقة للاستعلام و المقارنة مع هذه الأشعة للحصول على المستندات الموافقة لهذا الاستعلام . من خلال عملية تجريد للمصطلحات الواردة في المستندات تم الحصول على كفاءة استرجاع أفضل , و تعرضنا للعديد من خوارزميات التجريد التي وصلت إليها الدراسات السابقة . و تأتي عملية عنقدة المستندات كإضافة هامة , حيث يتمكن المستخدم من معرفة المستندات المشابهة لنتيجة البحث و التي لها صلة بـالاستعلام المدخل . في التطبيق العملي , تم العمل على نظام استرجاع معلومات مكتبي , يقوم بقراءة نصوص ذات أنواع مختلفة و عرض النتائج مع العناقيد الموافقة لها .
نعرض في هذا العمل جهودنا في بناء نظام ترجمة باستخدام تقنية التعلم العميق ، ونبين الطريقة التي اتبعناها في تطوير النموذج ، وإضاقة طرق تفيد في تحسين دقة الترجمة من اللغة الإنكليزية إلى اللغة العربية.
في الآونة الأخيرة، تم عرض فئة من تقنيات التتبع تسمى "التتبع عن طريق الكشف" لإعطاء نتائج واعدة بسرعات في الوقت الحقيقي، تقوم هذه الطرق بتدريب المصنف التمييزي بطريقة عبر الانترنت لفصل الكائن عن الخلفية. يعمل المصنف على تمهيد نفسه باستخدام حالة التعقب الحالية لاستخراج أمثلة إيجابية وسلبية من الإطار الحالي. وبالتالي ، يمكن أن تؤدي الأخطاء الطفيفة في المتعقب إلى أمثلة تدريب مصنفة بشكل غير صحيح ، مما يؤدي إلى تدهور المصنف ويمكن أن يتسبب في الانجراف. في هذه الورقة ، نوضح أن استخدام التتبع البسيط عبر الإنترنت وفي الوقت الفعلي ( SORT) وهو نهج عملي لتتبع الكائنات المتعددة مع التركيز على خوارزميات بسيطة و فعالة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا