دراسة مقارنة بين R و Rapidminer كأدتين للتنقيب في المعطيات (Data Mining)

Comparative Study between R and Rapidminer as Data mining Tools

أعلن في شمرا
759   1   109   3.0 ( 1 )
 تاريخ النشر 2014
 تمت اﻹضافة من قبل شمرا

تمثل قدرة التنقيب في المعطيات ( Data Mining ) على استخلاص معلومات تنبوئية من قواعد معطيات ضخمة أداة فعالة في يد الشركات و الأفراد تتيح لهم التركيز على النواحي التي تهمهم من المعطيات الضخمة التي تولدها مسيرة عملهم اليومية. و مع تزايد أهمية هذا العلم تزايدت بشكل متسارع الأدوات التي بنيت لتطبيق مفاهيمه النظرية بأسرع ما يمكن , حتى غدا من الصعب اتخاذ القرار حول أي من هذه الأدوات هو الأمثل لأداء مهمتك المرجوة. تقدم الدراسة مقارنة بين أداتي التنقيب في المعطيات الأكثر استخداما وفقا لاستطلاعات الرأي و هما Rapidminer و لغة البرمجة R بهدف مساعدة الباحث أو المطور على اختيار الأنسب بينهما. اعتمدت المقارنة على سبعة معايير : منصة العمل , الخوارزميات المضمنة, الصيغ المتاحة للدخل و الخرج , إمكانية التمثيل الرسومي , تقييم المستخدمين , البنية و امكانيات التطوير , الأداء بتطبيق مجموعة من خوارزميات التصنيف على عدد من مجموعات البيانات ( data set ) و باستخدام تقنيتي تقسيم cross validation و hold-out للتأكد من النتائج . من خلال الدراسة تبين أن R هي الأداة التي تدعم أكبر عدد من الخوارزميات و صيغ الدخل و الخرج و التمثيل الرسومي بينما تفوق Rapidminer من حيث سهولة الاستخدام و دعمه لعدد أكبر من منصات العمل. أما من حيث الأداء فدقة المصنفات التي بنيت باستخدام مكتبات كانت أعلى إلا في بعض الحالات التي فرضتها طبيعة المعطيات حيث لم يضف أي مرحلة معالجة مسبقة. و أخيرا يغدو الخيار في تفضيل أي الأداتين معتمدا على مدى خبرة المستخدم و هدفه من استخدام الأداة.

المراجع المستخدمة
KABACOFF R.2011-R in Action Data Analysis and Graphics with R. Manning Publications، 472 p
HAN J. KAMBER M. and PEI J.2011-Data Mining: Concepts and Techniques. Morgan Kaufmann، Third edition، San Francisco، 744 p
WITTEN I. H. FRANK E. and HALL M. A. 2011-Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann، Third edition، San Francisco، 664p
LIU H. and ZHAO Z. A.2012- Spectral Feature Selection for Data Mining. Chapman & Hall/CRCPress، Virginia Beach، VA، 219p
LIU H. and MODTODA H.2008-Computational Methods of Feature Selection. Chapman & Hall، BocaRaton، FL، 440p
قيم البحث
أعلن في شمرا
التعليقات
جاري جلب التعليقات جاري جلب التعليقات