أوراق بحثية, رسائل ماجستير ودكتوراه حول التنقيب في البيانات

تحسين فعالية خوارزمية الأسبقية بتخفيض توليد مجموعات بنود البيانات المُرشحة

2987 - جامعة البعث 2017 ورقة بحثية

قواعد الارتباط هي حقل هام في التنقيب عن البيانات، و الذي يُستخدم لاكتشاف معرفة مفيدة من قواعد بيانات ضخمة. و تُستخدم قواعد الارتباط لاستخلاص معلومات من صفقات قواعد البيانات. و خوارزمية الأسبقية هي التطبيق العملي لقواعد الارتباط، و بدورها تُستخدم ل إيجاد مجموعات من البيانات المتكررة في صفقات قواعد البيانات. نقدّم في هذا البحث تحسيناً جديداً لخوارزمية الأسبقية بتخفيض توليد مجموعات بنود البيانات المُرشّحة مما يؤدي إلى زيادة فعّالية خوارزمية الأسبقية.

Data Mining التنقيب في البيانات Association Rules صفقات قواعد الارتباط خوارزمية الأسبقية مجموعات بنود البيانات المرشحة مجموعات بنود البيانات المتكررة Apriori Algorithm Transactions Candidate Itemsets Frequent Itemsets المزيد..

استخدام تقنيات التنقيب في البيانات لدعم جودة التعليم حالة عملية: المعهد العالي لإدارة الإعمال HIBA

2072 - المعهد العالي للعلوم التطبيقية والتكنولوجيا 2017 رسالة ماجستير

يندرج هذا البحث في سياق الأبحاث التي تعمل على ضبط جودة مدخلات العملية التعليمية و تحسين آلياتها لضمان مخرجات هذه العملية ممثلة بمستوى الطالب الخريج.

Fuzzy Logic العملية التعليمية Educational Data Mining جودة العملية التعليمية المنطق الغائم التنقيب في البيانات التعليمية قواعد القبول الخطة الدراسية الطالب الحرج Educational process Education Quality Study Plan Critical Student المزيد..

تصنيف النصوص العربية باستخدام الخصائص العرضية في قواعد البيانات

2717 - جامعة البعث 2016 ورقة بحثية

قدمنا في هذا البحث دراسة مفصلة لطرق التنقيب في البيانات النصية و الإمكانيات المتوفرة في لغة الاستعلام الإجرائية PL/SQL التي تتعامل مع قواعد بيانات أوراكل الغرضية للقيام بذلك. و من ثم قمنا ببناء نموذج تنقيب يعمل على تصنيف وثائق النصوص العربية باست خدام خوارزمية SVM لفهرستها و من ثم تحويلها إلى جداول بيانات مدخلة في جداول الحالة لتصنيفها باستخدام خوارزمية Naïve Bayes و قدمنا الاستنتاجات و التوصيات بعد تقييم النتائج التي حصلنا عليها.

Data Mining Algorithms قواعد البيانات الغرضية الأغراض النصية التنقيب في البيانات النصية خوارزمية التصنيف البيزياني البيانات غير المهيكلة خوارزمية SVM Object Oriented Database Text Objects Data Mining Texts SVM Algorithm Naïve Bayes Algorithm Unstructured Data المزيد..

تحليل الآراء في تويتر

2818 - جامعة البعث 2016 ورقة بحثية

قمنا بإحضار البيانات من صفحات مواقع التواصل الاجتماعي تويتر، ثم عملنا عليها عملية تنظيف و تجهيز للنص من أجل عملية التصنيف فالنصوص المسترجعة تحتوي على الكثير من الضجيج و المعلومات غير المفيدة المتعلقة بعملية تحليل الآراء مثل الاعلانات و الروابط و ع ناوين البريد الالكتروني و وجود العديد من الكلمات التي لا تؤثر على التوجه العام للنص، و بعد الحصول على كل المنشورات في صفحة الفيسبوك و ما هي التعليقات الخاصة حول كل المنشور المراد معرفة النسبة المئوية للآراء الإيجابية و الآراء السلبية له. طبّقنا خوارزمية بايز في التصنيف و أجرينا عليها التدريب المناسب و بعد تمرير بيانات التغريدات (الآراء) حصلنا على نتائج جيدة حول نسبة المؤيدين للمنشور و نسبة المعارضين له.

شفرة الوصول Access token تصنيف المشاعر التنقيب في الآراء Opinions mining Sentiment classification

استخدام تقنيات التنقيب في البيانات لتحليل مستوى الطلاب

3825 - جامعة البعث 2016 ورقة بحثية

يهدف هذا البحث إلى تقديم دراسة حالة عن استخدام تقنيات التنقيب في بيانات المؤسسات التعليمية, و ذلك من خلال استعمال تقنيات التنقيب في البيانات.

Data Mining التنقيب في البيانات التنقيب في بيانات المؤسسات التعليمية برنامج ذكاء الأعمال الخاص بشركة مايكروسوفت خوارزمية مايكروسوفت لأشجار القرار خوارزمية مايكروسوفت للتجميع و الكشف عن الحالات الشاذة خوارزمية مايكروسوفت لقواعد الارتباط Educational Data Mining SQL Server Business Intelligence Development Studio Microsoft Decision Trees Microsoft Clustering Outlier Detection Microsoft Association Rules المزيد..

تقييم طرق تقدير عدد العناقيد في حالة العنقدة الهرمية التكتلية

2232 - جامعة البعث 2016 ورقة بحثية

إن الهدفَ الرئيسي من عمليةِ التنقيب في البيانات هو استخراج المعلومات و اكتشاف المعرفةِ من قواعدِ البياناتِ الضخمة، حيث تُعتبر العنقدة أحد أهم الوظائف التي يمكن القيامَ بها في هذا المجال. يوجدُ العديدُ من طرقِ و خوارزمياتِ العنقدة، إلا أن تحديد أو تقدير عدد العناقيد التي يجبُ استخراجها من عينةٍ ما يعتبر من أهم القضايا التي تواجها معظمُ هذه الطرق. يركز هذا البحث على مسألةِ تقديرِ عدد العناقيد في حالةِ العنقدة الهرمية. نقَدم في هذا البحث تقييماً لثلاثةٍ من أكثرِ الطرقَ شيوعاً في تقديرِ عددِ العناقيد.

العنقدة Clustering Artificial intelligence Data Mining التنقيب في البيانات الذكاء الصنعي تقدير عدد العناقيد Estimatimg number of clusters المزيد..

استخدام التنقيب في البيانات لمساعدة الآلة في تمييز المحارف المكتوبة يدوياً

1939 - جامعة البعث 2016 ورقة بحثية

نقدم في بحثنا طريقة بسيطة, لتمييز صور المحارف المكتوبة يدوياً بالاعتماد على عمليات التنقيب التنبئي. و ذلؾ من خلال استخراج إحداثيات النقاط السوداء من صور المحارف الثنائية اللون (أسود, أبيض) المستخدمة في مراحل التدريب و الاختبار. و تخزينها في قاعدة بيانات, و فق بنية مناسبة لعمليات التنقيب التنبئي (بيانات تدريب و بيانات اختبار). و من ثم استخدام بيانات التدريب المستخرجة لبناء نموذج تنبئي يساعد على تمييز صور الاختبار, اعتماداً على خصائصها المستخرجة. و قد أجرينا عدة اختبارات على عينات مختلفة من صور المحارف المكتوبة يدوياً, و حصلنا على نتائج دقيقة, ضمن الشروط المطلوبة.

Machine learning Data Mining التنقيب في البيانات التعرف البصري على المحارف تعليم الآلة طرق التنقيب في البيانات خوارزمية التنقيب Optical Characters Recognition Data Mining Function Data Mining Algorithms المزيد..

توظيف خوارزميات التنقيب في البيانات لتحليل حوادث المرور

6598 - جامعة تشرين 2015 ورقة بحثية

تقدم هذه الورقة البحثية مقارنة لمجموعة من خوارزميات التنقيب في البيانات Data Mining Algorithms فيما يتعلق بتحليل حوادث المرور، انطلاقاً من مرحلة إدخال البيانات، و ذلك من خلال تحليل بنية التقارير الإحصائية الموجودة في فرع مرور اللاذقية وصولاً إلى مرحل ة التنقيب في البيانات التي تستطيع إيجاد آلية قادرة على دراسة العوامل التي تلعب دوراً في حادث المرور بذكاء من أجل الربط و تحديد مدى العلاقة بينها و أهميتها في تسبب الحادث المروري، و ذلك بعد تصميم بنية مستودع البيانات على أساس قاعدة البيانات التي تم بناؤها لتخزين المعلومات، تم في هذا البحث ذكر مجموعة من النماذج التي تم اختبارها و التي تشكل عينة عن الاختبارات التي بنيت عليها نتائج البحث.

Classification العنقدة Clustering Data Mining التنقيب في البيانات التصنيف حوادث المرور مستودعات البيانات قواعد بيانات معرفية قواعد الاقتران Traffic Accidents Data Warehouse Knowledge Database Association Rules المزيد..

تحسين خوارزميات K-Means

6971 - جامعة البعث 2014 ورقة بحثية

تصنف خوارزمية K-Means الكائنات إلى عدد محدد مسبقا من العناقيد و هو K عنقود. و تتم عملية اختيار المراكز العنقودية في هذه الخوارزمية بشكل العشوائية، و يفضل أن تكون هذه المراكز بعيدة عن بعضها البعض قدر الإمكان. تؤثر نقطة البدء العشوائية على فعالية عملي ة التجميع و النتائج. و تعتمد عملية المقاربة المعنقدة على قيم المراكز الأولية بشكل رئيسي. نركّز في هذا البحث على طريقة اختيار مركز العنقود لتحسين أداء العنقدة في الخوارزمية K-Means كما نستخدم مراكز العناقيد الأولية و التي حصلنا عليها من البيانات المقسّمة على طول محور البيانات وفقا لأعلى فرق لتعيين مركز العنقود الأفضل.

fuzzy system facial expression خوارزمية التقسيم العنقدة Clustering Centroid K-Means المركز المزيد..

دراسة مقارنة بين R و Rapidminer كأدتين للتنقيب في المعطيات (Data Mining)

3630 - جامعة البعث 2014 ورقة بحثية

تمثل قدرة التنقيب في المعطيات ( Data Mining ) على استخلاص معلومات تنبوئية من قواعد معطيات ضخمة أداة فعالة في يد الشركات و الأفراد تتيح لهم التركيز على النواحي التي تهمهم من المعطيات الضخمة التي تولدها مسيرة عملهم اليومية. و مع تزايد أهمية هذا العلم ت زايدت بشكل متسارع الأدوات التي بنيت لتطبيق مفاهيمه النظرية بأسرع ما يمكن , حتى غدا من الصعب اتخاذ القرار حول أي من هذه الأدوات هو الأمثل لأداء مهمتك المرجوة. تقدم الدراسة مقارنة بين أداتي التنقيب في المعطيات الأكثر استخداما وفقا لاستطلاعات الرأي و هما Rapidminer و لغة البرمجة R بهدف مساعدة الباحث أو المطور على اختيار الأنسب بينهما. اعتمدت المقارنة على سبعة معايير : منصة العمل , الخوارزميات المضمنة, الصيغ المتاحة للدخل و الخرج , إمكانية التمثيل الرسومي , تقييم المستخدمين , البنية و امكانيات التطوير , الأداء بتطبيق مجموعة من خوارزميات التصنيف على عدد من مجموعات البيانات ( data set ) و باستخدام تقنيتي تقسيم cross validation و hold-out للتأكد من النتائج . من خلال الدراسة تبين أن R هي الأداة التي تدعم أكبر عدد من الخوارزميات و صيغ الدخل و الخرج و التمثيل الرسومي بينما تفوق Rapidminer من حيث سهولة الاستخدام و دعمه لعدد أكبر من منصات العمل. أما من حيث الأداء فدقة المصنفات التي بنيت باستخدام مكتبات كانت أعلى إلا في بعض الحالات التي فرضتها طبيعة المعطيات حيث لم يضف أي مرحلة معالجة مسبقة. و أخيرا يغدو الخيار في تفضيل أي الأداتين معتمدا على مدى خبرة المستخدم و هدفه من استخدام الأداة.

Information retrieval fuzzy system Clustering Data Mining R Rapidminer Tools التنقيب في البيانات استرجاع البيانات أدوات خوارزمية التصنيف خوارزميات التجميع المزيد..

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد