ترغب بنشر مسار تعليمي؟ اضغط هنا

مع التطور الهائل في جميع المجالات العلمية و الاقتصادية و السياسية و غيرها ظهرت الحاجة لإيجاد طرق غير تقليدية للتعامل من خلالها مع البيانات بجميع أنماطها ( النصية و المرئية و الصوتية و غيرها ) والتي أصبحت ذات حجوم كبيرة جداً في هذه الأيام. فكان لابد م ن إيجاد طرق جديدة لاستنباط المعرفة و المعلومات المخبأة ضمن هذا الكم الهائل من البيانات كالاستعلام عن الزبائن الذين لديهم عادات شرائية متماثلة أو التوقعات المحتلمة لبيع سمعة معينة في إحدى المناطق الجغرافية و غيرها من الاستعلامات الاستنتاجية و التي تعتمد على تقنية التنقيب في البيانات. و تتم عملية التنقيب بعدة أساليب من أهمها أسلوب العنقدة (التجميع) Clustering و الذي يتم بعدة خوارزميات. سوف نرّكز في بحثنا هذا على استخدام طريقة مدروسة لإيجاد المراكز الابتدائية لخوارزمية K-Medoids التي تقوم على مبدأ تقسيم البيانات إلى عناقيد كل عنقود يحوي بيانات متماثمة يَسهل التعامل معها بدلاً من اختيارها بالشكل العشوائي الذي يؤدي بدوره لظهور نتائج مختلفة وبطئ في تنفيذ الخوارزمية .
تصنف خوارزمية K-Means الكائنات إلى عدد محدد مسبقا من العناقيد و هو K عنقود. و تتم عملية اختيار المراكز العنقودية في هذه الخوارزمية بشكل العشوائية، و يفضل أن تكون هذه المراكز بعيدة عن بعضها البعض قدر الإمكان. تؤثر نقطة البدء العشوائية على فعالية عملي ة التجميع و النتائج. و تعتمد عملية المقاربة المعنقدة على قيم المراكز الأولية بشكل رئيسي. نركّز في هذا البحث على طريقة اختيار مركز العنقود لتحسين أداء العنقدة في الخوارزمية K-Means كما نستخدم مراكز العناقيد الأولية و التي حصلنا عليها من البيانات المقسّمة على طول محور البيانات وفقا لأعلى فرق لتعيين مركز العنقود الأفضل.
تقدم هذه الورقة البحثية مقارنة لمجموعة من خوارزميات التنقيب في البيانات Data Mining Algorithms فيما يتعلق بتحليل حوادث المرور، انطلاقاً من مرحلة إدخال البيانات، و ذلك من خلال تحليل بنية التقارير الإحصائية الموجودة في فرع مرور اللاذقية وصولاً إلى مرحل ة التنقيب في البيانات التي تستطيع إيجاد آلية قادرة على دراسة العوامل التي تلعب دوراً في حادث المرور بذكاء من أجل الربط و تحديد مدى العلاقة بينها و أهميتها في تسبب الحادث المروري، و ذلك بعد تصميم بنية مستودع البيانات على أساس قاعدة البيانات التي تم بناؤها لتخزين المعلومات، تم في هذا البحث ذكر مجموعة من النماذج التي تم اختبارها و التي تشكل عينة عن الاختبارات التي بنيت عليها نتائج البحث.
يعد التعقب باستخدام شبكات الحساسات اللاسلكية من التطبيقات التي تشهد نمواً كبيراً. و نظرا لمحدودية شبكات الحساسات اللاسلكية من حيث مصدر الطاقة، تستمر الأبحاث لتحسين طرق نقل المعلومات و توجيهها بما يضمن استهلاكاً أقل للطاقة. لذلك قمنا في هذا البحث بتحس ين طريقة توجيه معلومات موقع الهدف في الشبكة و ذلك بتقديم خوارزمية جديدة، تستفيد من مفهوم العنقدة في شبكة الحساسات اللاسلكية، مع إضافة إمكانية التفاعل ما بين الحساسات الحقلية التي تنتمي لعناقيد مختلفة، حيث لا يمكن التفاعل فيما بينها في الحالة التقليدية لعمل الشبكات العنقودية، و ذلك اعتماداً على بارامتر شدة الإشارة المستقبلة من الهدف في الحساسات لغاية التخلص من تكرار نقل نفس المعلومة، مما ينعكس إيجاباً على عمر الشبكة و الحصول أيضاً على إشارة أكثر دقة لموقع الهدف. قمنا بتطبيق الخوارزمية المقترحة و إظهار نتائجها باستخدام محاكي OPNET الذي يعد من أفضل المحاكيات في مجال الشبكات بأنواعها المختلفة.
إن الهدفَ الرئيسي من عمليةِ التنقيب في البيانات هو استخراج المعلومات و اكتشاف المعرفةِ من قواعدِ البياناتِ الضخمة، حيث تُعتبر العنقدة أحد أهم الوظائف التي يمكن القيامَ بها في هذا المجال. يوجدُ العديدُ من طرقِ و خوارزمياتِ العنقدة، إلا أن تحديد أو تقدير عدد العناقيد التي يجبُ استخراجها من عينةٍ ما يعتبر من أهم القضايا التي تواجها معظمُ هذه الطرق. يركز هذا البحث على مسألةِ تقديرِ عدد العناقيد في حالةِ العنقدة الهرمية. نقَدم في هذا البحث تقييماً لثلاثةٍ من أكثرِ الطرقَ شيوعاً في تقديرِ عددِ العناقيد.
نقدم في هذا البحث خوارزمية جديدة لحل بعض المشاكل التي تعاني منها خوارزميات عنقدة البيانات كالK-Means. هذه الخوارزمية الجديدة قادرة على عنقدة مجموعة من البيانات بشكل منفرد دون الحاجة لخوارزميات عنقدة أخرى.
اختيار الطريقة المناسبة لتجزيء مجموعة من البيانات الكبيرة والتي تصف مجموعة من الخصائص الخاصة بمجال معين الى عناقيد (مجموعات) والمقارنة بين الطرق المختلفة للعنقدة بتجزيء الفضاء من حيث الإيجابيات والسلبيات وعرض التطبيقات المختلفة عليها واستخداماتها
إن البيئة الإفتراضية هي البنية الأساسية و المكون الأهم من مكونات الحوسبة السحابية و نظرا لما تقدمه البيئة الإفتراضية من ميزات لا تقدمها البيئات غير الإفتراضية من مرونة و توفير للطاقة و التكلفة و الاستخدام الأمثل للموارد جعل معظم شركات الاعمال و الحكو مات تتجه لتحميل خدماتها و تطبيقاتها على مخدمات افتراضية بدلا من المخدمات الفيزيائية و من هذا المنطلق اتجه الباحثون لمقارنة اداء البيئات الإفتراضية المختلفة بهدف الحصول على أفضل بيئة ممكنة ليتم استخدامها في الحوسبة السحابية و تحقيق الحوسبة عالية الأداء. تم تقييم تأثير البيئة الافتراضية على "الحوسبة عالية الأداء كخدمة و ذلك من خلال تغيير نوع البيئة الإفتراضية المستخدمة كبنية تحتية في الحوسبة السحابية . تم استخدام البيئة الإفتراضية XEN-PV( XEN Paravirtualization ) كبنية تحتية للحوسبة عالية الأداء و من ثم البيئة الإفتراضية (XEN-Hardware virtual machine) XEN-HVM حيث أن ال XEN هو ال hypervisor الأساسي لشركة Citrix و هي شركة رائدة في تطوير البيئات الإفتراضية و تم تقيم الأداء عند استخدام نظام التخزين التكراري المتماثل DRBD (Distributed Replicated Block Device ) كجهاز تخزين مشترك للأقراص الإفتراضية في العنقود. إن نتائج هذا البحث تثبت أن تقنية البيئة الافتراضية و مخطط العنقدة المستخدم لهما دور مهم في تحسين أداء "الحوسبة عالية الأداء".
يهدف التنقيب عن البيانات التعليمية إلى دراسة البيانات المتوفرة في المجال التعليمي وإخراج المعرفة المخفية منه بغية الاستفادة منها في تعزيز عملية التعليم واتخاذ قرارات ناجحة من شأنها تحسين الأداء الأكاديمي للطالب. تقترح هذه الدراسة استخدام تقنيات التنق يب عن البيانات لتحسين التنبؤ بأداء الطلاب، حيث تم تطبيق ثلاث خوارزميات تصنيف Naïve Bayes, J48, Support Vector Machine)) على قاعدة بيانات أداء الطلاب ، ثم تم تصميم مصنف جديد لدمج نتائج تلك المصنفات الفردية باستخدام تقنية الدمج Voting Method . تم استخدام الأداة WEKAالتي تدعم الكثير من خوارزميات و طرائق التنقيب في البيانات. تظهر النتائج أن مصنف الدمج لديه أعلى دقة للتنبؤ بمستويات الطلاب مقارنة بالمصنفات الأخرى ، حيث حقق دقة تعرف وصلت إلى74.8084 % . و أفادت خوارزمية العنقدةsimple k-means في تجميع الطلاب المتشابهين في مجموعات منفصلة بالتالي فهم مميزات كل مجموعة مما يساعد على قيادة وتوجيه كل مجموعة على حدى.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا