ترغب بنشر مسار تعليمي؟ اضغط هنا

تصنيف النصوص

Text classification problem

3850   6   294   0 ( 0 )
 تاريخ النشر 2018
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shaymaa Shahma




اسأل ChatGPT حول البحث

تصنيف النصوص هو واحد من المجالات الهامة في معالجة اللغة الطبيعية. تمت دراسة مشكلة التصنيف على نطاق واسع في استخراج البيانات ، التعلم الآلي ، وقاعدة البيانات ، و مجال استرجاع المعلومات مع التطبيقات في عدد من المجالات المتنوعة ، مثل التسويق المستهدف ، التشخيص الطبي ، تصفية مجموعة الأخبار ، وتنظيم الوثائق ، تحديد موضوع مقالة إخبارية ، تحليل المشاعر. ومن المعروف أنه من المستحيل تعريف أفضل مصنف نصي فمثلا في مجالات مثل الرؤية الحاسوبية Computer Vision ، هناك إجماع قوي حول طريقة عامة لتصميم النماذج والشبكات العصبونية وغيرها من المنهجيات المعتمدة . و بخلاف ذلك ، لا يزال تصنيف النص يفتقر إلى هذه الطريقة العامة في مجالات كثيرة . نهدف في هذا البحث إلى تقديم مسح شامل لمجموعة من المنهجيات والخوارزميات المستخدمة لتصنيف النصوص ، والتحسينات التي طرأت عليها . سنركز على المقاربات العامة الرئيسية لخوارزميات تصنيف النص وحالات الاستخدام الخاصة بها

المراجع المستخدمة
https://link.springer.com/chapter/10.1007%2F978-1-4614-3223-4_6
قيم البحث

اقرأ أيضاً

يعتبر تركيب الكلام بشكل آلي من أهم المسائل المطروحة في الذكاء الصنعي منذ بداياته، حيث تتزايد الحاجة لأنظمة تركيب كلام مستقرة بحيث تنتج خطاباً ذكياً مع كيفية الكلام الطبيعي. تركيب الكلام speech synthesis يعتبر الأهم في تصنيع آلات متحدثة قادرة على التو اصل مع الإنسان بطريقة فعالة وبسيطة، سواء في أنظمة الحوار الآلي Auto dialogue systems، توليد آلي للكتب الصوتية Auto generating of Audio books، متحدث مساعد لذوي الاحتياجات الخاصة different able humans، وغير ذلك من الأنظمة التي تحتاجها البشرية اعتماداً على معالجة اللغات الطبيعيةNatural language processing وفهم الكلام Language Understanding في سبيل خدمة التواصل بين الآلة والإنسان Human-computer Interaction.
انتشرت كلمة "البيانات الضخمة" في عام 2017 وأصبحت الأكثر شيوعًا في صناعة التكنولوجيا المتقدمة، حيث يستخدم التعلم الآلي الذي يسمح لأجهزة الكمبيوتر لتحليل البيانات السابقة والتنبؤ بالبيانات المستقبلية على نطاق واسع في الأماكن المألوفة. ويمكن لغير المتخص صين في التعلم الآلي استخدامه أيضًا. ولدراسة الطريقة التحليلية للتعلم الآلي الإحصائي لا بد من التعرف على مفهوم الذكاء الاصطناعي وتصنيفه الرئيسي والتقنيات التحليلية المتضمنة والمتمثلة في التعلم الالي والتعلم العميق. لقد تطور التعلم الآلي بفضل بعض الاختراقات في مجال الذكاء الاصطناعي . وهي ادراك كفاءة تعليم أجهزة الكمبيوتر اضافة الى اختراع الانترنت. ويبقى للشبكات العصبية دور مهم وضروري لتعليم أجهزة الكمبيوتر التفكير مثل البشر ، حيث تُستخدم هذه الشبكات البيانات التي يستطيعون الوصول إليها لاتخاذ القرارات. وتوجد العديد من الخوارزميات للتعرف على التعلم الالي ،وما نؤكد عليه في دراستنا إظهار طرق وتطبيقات التحليل الإحصائي الآلي ، مثل "تحليل الانحدار" و "شجرة القرارات" و "طريقة متوسط k" و"تحليل الرابطة"
مع زيادة الشبكات الاجتماعية ، بدأ الناس في مشاركة المعلومات عبر أنواع مختلفة من وسائل التواصل. في هذا العمل قمنا بالاستفادة من قصص الأطفال وتوظيفها لتعليم الاطفال وذلك عن طريق قراءة قصة لهم وتحويلها إلى نص ومعالجة النص باستخدام اللغات الطبيعية و استخراج المشاعر بشكل اتوماتيكي من هذه القصة و لتحقيق ذلك قمنا باستخدام عدة تقنيات و دمجها و قارنا بين نتائجها على عدد من القصص القصيرة المخصصة للأطفال حيث تم استخدام كل من التقنيات المختلفة غير الخاضعة للإشراف مثال Dictionary Basedأو خاضعة للإشراف كالشبكات العصبونية التي تعتمد على البيانات لتحليل المشاعر حيث استخدمنا مصنفات متعددة وهي Support Vector Machineوstochastic Gradient Descent و Decision Tree و Random ForestوNaïve BayesوK-Nearest NeighborوNearest Centroidكذلك استخدمنا الشبكات العصبونية العميقة كمثال الشبكات العصبونية التكرارية RNNو في النهاية تم التوصل إلى استنتاج المشاعر الصحيحة للقصة من خلال Dictionary Basedالتي اعطت افضل دقة ثم إظهار صورة التعبير الصحيح الذي يبين للطفل التعبير المراد إبداؤه عند سماع أحداث هذه القصةليتفاعل معه ويتعلم التعبير الصحيح
يهدف المشروع في المقام الأول إلى توظيف الذكاء الاصطناعي ، وتحديداً مهارات برمجة شبكة عصبية حيث الشبكات العصبية بدورها هي شبكات مهتمة بالتدريب والتعلم من الخطأ ، وتوظيف هذا الخطأ لتحقيق أفضل النتائج. (CNN) على وجه الخصوص هي واحدة من أهم الشبكات العص بية التي تعالج مشاكل وقضايا التصنيف. وبالتالي فإن هذا المشروع يهدف إلى تصميم شبكة عصبية التفافية تصنف المركبات إلى عدة أنواع حيث سنقوم بتصميم الشبكة وتدريبها على قاعدة البيانات حيث أن قاعدة البيانات تتضمن صورًا لأنواع متعددة من المركبات وستقوم الشبكة بتصنيف كل صورة إلى نوعها ، بعد تعديل الصور وإجراء التغييرات المناسبة وتحويلها إلى اللون الرمادي واكتشاف الحواف والخطوط وبعد أن تصبح الصور جاهزة تبدأ عملية التدريب وبعد انتهاء عملية التدريب سنخرج بنتائج التصنيف وبعدها اختبار بمجموعة جديدة من الصور ومن اهم تطبيقات هذا المشروع الالتزام برصف السيارات والشاحنات والمركبات بشكل عام وكأن صورة تم ادخالها كسيارة لعينة السيارة وهي شاحنة ، على سبيل المثال ، سيعطي هذا خطأ حيث ستكتشف الشبكة ذلك من خلال فحصها وتصنيفها. كشاحنة ، نكتشف أن هناك انتهاكًا لقوانين الرصف
في الآونة الأخيرة، تم عرض فئة من تقنيات التتبع تسمى "التتبع عن طريق الكشف" لإعطاء نتائج واعدة بسرعات في الوقت الحقيقي، تقوم هذه الطرق بتدريب المصنف التمييزي بطريقة عبر الانترنت لفصل الكائن عن الخلفية. يعمل المصنف على تمهيد نفسه باستخدام حالة التعقب الحالية لاستخراج أمثلة إيجابية وسلبية من الإطار الحالي. وبالتالي ، يمكن أن تؤدي الأخطاء الطفيفة في المتعقب إلى أمثلة تدريب مصنفة بشكل غير صحيح ، مما يؤدي إلى تدهور المصنف ويمكن أن يتسبب في الانجراف. في هذه الورقة ، نوضح أن استخدام التتبع البسيط عبر الإنترنت وفي الوقت الفعلي ( SORT) وهو نهج عملي لتتبع الكائنات المتعددة مع التركيز على خوارزميات بسيطة و فعالة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا