بحث متقدم
ترتيب حسب
فلترة حسب
تصنيف النصوص هو واحد من المجالات الهامة في معالجة اللغة الطبيعية. تمت دراسة مشكلة التصنيف على نطاق واسع في استخراج البيانات ، التعلم الآلي ، وقاعدة البيانات ، و مجال استرجاع المعلومات مع التطبيقات في عدد من المجالات المتنوعة ، مثل التسويق المستهدف ، التشخيص الطبي ، تصفية مجموعة الأخبار ، وتنظيم الوثائق ، تحديد موضوع مقالة إخبارية ، تحليل المشاعر. ومن المعروف أنه من المستحيل تعريف أفضل مصنف نصي فمثلا في مجالات مثل الرؤية الحاسوبية Computer Vision ، هناك إجماع قوي حول طريقة عامة لتصميم النماذج والشبكات العصبونية وغيرها من المنهجيات المعتمدة . و بخلاف ذلك ، لا يزال تصنيف النص يفتقر إلى هذه الطريقة العامة في مجالات كثيرة . نهدف في هذا البحث إلى تقديم مسح شامل لمجموعة من المنهجيات والخوارزميات المستخدمة لتصنيف النصوص ، والتحسينات التي طرأت عليها . سنركز على المقاربات العامة الرئيسية لخوارزميات تصنيف النص وحالات الاستخدام الخاصة بها
قمنا في هذا البحث بدراسة خوارزمية من خوارزميات التصنيف غير المراقب تدعى خوارزمية التصنيف باستخدام عدد K من المتوسطات (K-means) فالخطوة الأساسية ليذه الخوارزمية ىي تحديد عدد K من العناقيد ثم حساب المسافة بين مركز كل عنقود و عناصر الصورة ليتم تخصيص هذه العناصر للعناقيد الأقرب بناء على قيمة مسافة مرجعية تدعى مسافة العتبة.
نفذ هذا البحث في مخابر قسم علوم الأغذية بكلية الزراعة بجامعة دمشق، و بمخبر الميكروبيولوجيا و المناعيات في هيئة الطاقة الذرية، حيث أخذ 20 كغ من مركز عصير التفاح بتركيز 70 % من معمل عصير الجبل الطبيعي في محافظة السويداء و منه حضر كل من التركيزيين 35 %-15% بإضافة الماء المقطر و المعقم حسب طريقة بيرسون.
تمَّ دمج عملية التحليل الإحصائي لتقنية عامل الدليل الأمثل (OIF) مع طريقة تصنيف شجرة القرار (DTC) في استخدام العتبات الحدية الطيفية المعايرة لفصل السمات عن بعضها في برامج معالجة الصورة الفضائيّة ضمن مقاربة ممنهجة و ذلك لاستخلاص السمة العمرانيّة و تحدي د مساحتها و انتشارها من الصور الفضائية. تم اختبار دقة هذه المقاربة الممنهجة بمقارنة النتائج المتحصل عليها مع نتائج التصنيف المراقب لهذه السمة من الصور الفضائية وفق قنواتها الأصلية و أخرى وفق قنواتها المركبة حسب عامل الدليل الأمثل. أعطت المقاربة المقترحة و المطبقة بشكل موجه على الجزء الغربي لمدينة السويداء من صور التابع الصنعي Quick Bird دقة تصنيف بلغت 98% مقارنة مع 93% بالتصنيف المراقب للصورة المركبة بقنوات/أدلة محددة بعامل الدليل الأمثل بينما كانت 82% مع التصنيف المراقب لقنوات الصورة الأساسية و يعود ذلك الى دقة هذه المقاربة في فصل السمة العمرانية عن تلك المشابهة لها طيفياً في الصورة الفضائية من تكشفات بازلتية و طرق مواصلات و التي يصعب فصلها بطرق المعالجة و التصنيف الأخرى.
تهدف الدراسة إلى تحديد درجة القطع لاختبار محكي المرجع يقيس تمكن تلاميذ الصف الخامس في مدينة حمص من حل المشكلات اللفظية التي تتطلب إجراء عملية القسمة و ما يلزمها من عمليات حسابية أخرى، باستخدام طريقة المجموعات المتناقضة، و التأكد من فاعليتها في الت قليل من أخطاء التصنيف مقارنة مع متوسط أداء أفراد عينة المتعلمين التي بلغ حجمها 400 / تلميذا و تلميذة. و لقد توصلت الدراسة إلى أن أخطاء التصنيف الناتجة عن درجة القطع / 74 / التي تم تحديدها بطريقة المجموعات المتناقضة، أقل من أخطاء التصنيف الناتجة عن درجة المتوسط 66 / مما يدل على فاعلية الطريقة المستخدمة، و انتهت الدراسة إلى بعض التوصيات.
نُفذ البحث خلال العامين 2014 و 2015 في محافظة طرطوس لحصر بعض طرز نوعي التوت Morus alba و Morus nigra في ستة مواقع متفاوتة في ارتفاعها عن سطح البحر (0 - 500م)، إذ تم تحديد 33 طرازاً (22 من النوع الأبيض و 11 من النوع الأسود) لتوصيفها مورفولوجياً و فينو لوجياً و تحديد درجة القرابة المورفولوجية بينها إضافةً لوضع مفاتيح تصنيفية خاصة بها. أُجري التحليل العنقودي للطرز مجتمعةً بناءاً على 14 صفة مورفولوجية (أوراق، نورات زهرية، ثمار) إضافةً للتحليل العنقودي لكل من طرز النوع الأبيض و النوع الأسود على حدا؛ إذ أظهرت شجرة القرابة المورفولوجية للطرز مجتمعة وجود مجموعتين مستقلتين بنسبة تباين وصلت لـ 48%، ضمت المجموعة الأولى ثلاثة طرز تابعة للنوع الأسود و الثانية 30 طرازاً تابعاً للنوعين معاً تراوحت نسبة التباين بينها من 0-38%، بينما أظهرت شجرة القرابة المورفولوجية لطرز التوت الأسود نسبة تباين وصلت لـ 47% مقارنة بـ 33% لطرز النوع الأبيض. إن درجة التشابه المورفولوجي متباينة بين الطرز المدروسة بغض النظر عن لون الثمار، و نسبة التباين ضمن طرز التوت الأسود أعلى منها ضمن طرز التوت الأبيض.
قدمنا في هذا البحث دراسة مفصلة لطرق التنقيب في البيانات النصية و الإمكانيات المتوفرة في لغة الاستعلام الإجرائية PL/SQL التي تتعامل مع قواعد بيانات أوراكل الغرضية للقيام بذلك. و من ثم قمنا ببناء نموذج تنقيب يعمل على تصنيف وثائق النصوص العربية باست خدام خوارزمية SVM لفهرستها و من ثم تحويلها إلى جداول بيانات مدخلة في جداول الحالة لتصنيفها باستخدام خوارزمية Naïve Bayes و قدمنا الاستنتاجات و التوصيات بعد تقييم النتائج التي حصلنا عليها.
قمنا بإحضار البيانات من صفحات مواقع التواصل الاجتماعي تويتر، ثم عملنا عليها عملية تنظيف و تجهيز للنص من أجل عملية التصنيف فالنصوص المسترجعة تحتوي على الكثير من الضجيج و المعلومات غير المفيدة المتعلقة بعملية تحليل الآراء مثل الاعلانات و الروابط و ع ناوين البريد الالكتروني و وجود العديد من الكلمات التي لا تؤثر على التوجه العام للنص، و بعد الحصول على كل المنشورات في صفحة الفيسبوك و ما هي التعليقات الخاصة حول كل المنشور المراد معرفة النسبة المئوية للآراء الإيجابية و الآراء السلبية له. طبّقنا خوارزمية بايز في التصنيف و أجرينا عليها التدريب المناسب و بعد تمرير بيانات التغريدات (الآراء) حصلنا على نتائج جيدة حول نسبة المؤيدين للمنشور و نسبة المعارضين له.
تهدف هذه الدراسة إلى تقييم رضا المريض عن الأجهزة الجزئية المثبتة بنوعين مختلفين من وصلات الإحكام خارج التاجية في الفك السفلي و ذلك في حالات الصنف الثاني من كنيدي Class II. استخدمت عينة مؤلفة من 10 مرضى لديهم فقد ثنائي الجانب في الفك السفلي و تم تحضي ر دعامتين (الضاحك الأول و الثاني) و التعويض كما يلي: يمين المريض وصلة من نوع MKI (وصلة صلبة ) و يسار المريض وصلة من نوع ASC 52 (وصلة مرنة) ثم أجري تقييم لرضا المرضى لكل من نوعي الوصلات بعد مرور شهر و 6 أشهر على استخدام الأجهزة و ذلك باستخدام مقياس من 0 5 (0=ممتاز ،1=جيد جداً ، 2=جيد ، 3=متوسط ، 4=سيء ، 5= سيء جداً ) بحيث يكون التقييم من حيث: الرضا العام متضمناً (الناحية الجمالية ، الكلام و الثبات)– الراحة – القدرة على المضغ – سهولة نزع الجهاز – اندخال الأطعمة تحت الجزء المتحرك. بينت النتائج، عدم وجود فرق ذو دلالة احصائية بين الوصلتين من ناحية: الرضا العام متضمناً (الناحية الجمالية، الكلام و الثبات)– الراحة – القدرة على المضغ – سهولة نزع الجهاز بعد مرور شهر و ستة أشهر على استخدام الأجهزة في حين تبين وجود فرق ذو دلالة احصائية في الرضا بين الوصلتين من ناحية اندخال الأطعمة تحت الجزء المتحرك بعد مرور شهر و ستة أشهر على استخدام الأجهزة ، وذلك عند مستوى دلالة P 0.05 .
قمنا في هذا البحث بإدخال خوارزمية اختيار السمات المستندة على الضبط regularization للاستفادة من خصائص الخلخلة و تجميع السمات و ادراجه في مهمة تصنيف الصور الطبية، باستخدام الطريقة المعتمدة على خلخلة المجموعة group sparsity التي تُمكن من الإبقاء أو ال حذف على مجموعة كاملة من السمات. إن الفكرة الأساسية في خلخلة المجموعة هي حذف السمات التي لا تؤثر على عملية الاستعادة بدلاً من الإبقاء على هذه السمات و اعطائها أوزان قليلة، و بالتالي تعتبر كخوارزمية لتحسين النظام عن طريق زيادة دقة النتائج بالإضافة الى تخفيض المتطلبات الزمنية و التخزينية التي يحتاجها النظام.