بحث متقدم
ترتيب حسب
فلترة حسب
اختيار الطريقة المناسبة لتجزيء مجموعة من البيانات الكبيرة والتي تصف مجموعة من الخصائص الخاصة بمجال معين الى عناقيد (مجموعات) والمقارنة بين الطرق المختلفة للعنقدة بتجزيء الفضاء من حيث الإيجابيات والسلبيات وعرض التطبيقات المختلفة عليها واستخداماتها
إن البيئة الإفتراضية هي البنية الأساسية و المكون الأهم من مكونات الحوسبة السحابية و نظرا لما تقدمه البيئة الإفتراضية من ميزات لا تقدمها البيئات غير الإفتراضية من مرونة و توفير للطاقة و التكلفة و الاستخدام الأمثل للموارد جعل معظم شركات الاعمال و الحكو مات تتجه لتحميل خدماتها و تطبيقاتها على مخدمات افتراضية بدلا من المخدمات الفيزيائية و من هذا المنطلق اتجه الباحثون لمقارنة اداء البيئات الإفتراضية المختلفة بهدف الحصول على أفضل بيئة ممكنة ليتم استخدامها في الحوسبة السحابية و تحقيق الحوسبة عالية الأداء. تم تقييم تأثير البيئة الافتراضية على "الحوسبة عالية الأداء كخدمة و ذلك من خلال تغيير نوع البيئة الإفتراضية المستخدمة كبنية تحتية في الحوسبة السحابية . تم استخدام البيئة الإفتراضية XEN-PV( XEN Paravirtualization ) كبنية تحتية للحوسبة عالية الأداء و من ثم البيئة الإفتراضية (XEN-Hardware virtual machine) XEN-HVM حيث أن ال XEN هو ال hypervisor الأساسي لشركة Citrix و هي شركة رائدة في تطوير البيئات الإفتراضية و تم تقيم الأداء عند استخدام نظام التخزين التكراري المتماثل DRBD (Distributed Replicated Block Device ) كجهاز تخزين مشترك للأقراص الإفتراضية في العنقود. إن نتائج هذا البحث تثبت أن تقنية البيئة الافتراضية و مخطط العنقدة المستخدم لهما دور مهم في تحسين أداء "الحوسبة عالية الأداء".
نقدم في هذا البحث خوارزمية جديدة لحل بعض المشاكل التي تعاني منها خوارزميات عنقدة البيانات كالK-Means. هذه الخوارزمية الجديدة قادرة على عنقدة مجموعة من البيانات بشكل منفرد دون الحاجة لخوارزميات عنقدة أخرى.
إن الهدفَ الرئيسي من عمليةِ التنقيب في البيانات هو استخراج المعلومات و اكتشاف المعرفةِ من قواعدِ البياناتِ الضخمة، حيث تُعتبر العنقدة أحد أهم الوظائف التي يمكن القيامَ بها في هذا المجال. يوجدُ العديدُ من طرقِ و خوارزمياتِ العنقدة، إلا أن تحديد أو تقدير عدد العناقيد التي يجبُ استخراجها من عينةٍ ما يعتبر من أهم القضايا التي تواجها معظمُ هذه الطرق. يركز هذا البحث على مسألةِ تقديرِ عدد العناقيد في حالةِ العنقدة الهرمية. نقَدم في هذا البحث تقييماً لثلاثةٍ من أكثرِ الطرقَ شيوعاً في تقديرِ عددِ العناقيد.
يعد التعقب باستخدام شبكات الحساسات اللاسلكية من التطبيقات التي تشهد نمواً كبيراً. و نظرا لمحدودية شبكات الحساسات اللاسلكية من حيث مصدر الطاقة، تستمر الأبحاث لتحسين طرق نقل المعلومات و توجيهها بما يضمن استهلاكاً أقل للطاقة. لذلك قمنا في هذا البحث بتحس ين طريقة توجيه معلومات موقع الهدف في الشبكة و ذلك بتقديم خوارزمية جديدة، تستفيد من مفهوم العنقدة في شبكة الحساسات اللاسلكية، مع إضافة إمكانية التفاعل ما بين الحساسات الحقلية التي تنتمي لعناقيد مختلفة، حيث لا يمكن التفاعل فيما بينها في الحالة التقليدية لعمل الشبكات العنقودية، و ذلك اعتماداً على بارامتر شدة الإشارة المستقبلة من الهدف في الحساسات لغاية التخلص من تكرار نقل نفس المعلومة، مما ينعكس إيجاباً على عمر الشبكة و الحصول أيضاً على إشارة أكثر دقة لموقع الهدف. قمنا بتطبيق الخوارزمية المقترحة و إظهار نتائجها باستخدام محاكي OPNET الذي يعد من أفضل المحاكيات في مجال الشبكات بأنواعها المختلفة.
تقدم هذه الورقة البحثية مقارنة لمجموعة من خوارزميات التنقيب في البيانات Data Mining Algorithms فيما يتعلق بتحليل حوادث المرور، انطلاقاً من مرحلة إدخال البيانات، و ذلك من خلال تحليل بنية التقارير الإحصائية الموجودة في فرع مرور اللاذقية وصولاً إلى مرحل ة التنقيب في البيانات التي تستطيع إيجاد آلية قادرة على دراسة العوامل التي تلعب دوراً في حادث المرور بذكاء من أجل الربط و تحديد مدى العلاقة بينها و أهميتها في تسبب الحادث المروري، و ذلك بعد تصميم بنية مستودع البيانات على أساس قاعدة البيانات التي تم بناؤها لتخزين المعلومات، تم في هذا البحث ذكر مجموعة من النماذج التي تم اختبارها و التي تشكل عينة عن الاختبارات التي بنيت عليها نتائج البحث.
تصنف خوارزمية K-Means الكائنات إلى عدد محدد مسبقا من العناقيد و هو K عنقود. و تتم عملية اختيار المراكز العنقودية في هذه الخوارزمية بشكل العشوائية، و يفضل أن تكون هذه المراكز بعيدة عن بعضها البعض قدر الإمكان. تؤثر نقطة البدء العشوائية على فعالية عملي ة التجميع و النتائج. و تعتمد عملية المقاربة المعنقدة على قيم المراكز الأولية بشكل رئيسي. نركّز في هذا البحث على طريقة اختيار مركز العنقود لتحسين أداء العنقدة في الخوارزمية K-Means كما نستخدم مراكز العناقيد الأولية و التي حصلنا عليها من البيانات المقسّمة على طول محور البيانات وفقا لأعلى فرق لتعيين مركز العنقود الأفضل.
مع التطور الهائل في جميع المجالات العلمية و الاقتصادية و السياسية و غيرها ظهرت الحاجة لإيجاد طرق غير تقليدية للتعامل من خلالها مع البيانات بجميع أنماطها ( النصية و المرئية و الصوتية و غيرها ) والتي أصبحت ذات حجوم كبيرة جداً في هذه الأيام. فكان لابد م ن إيجاد طرق جديدة لاستنباط المعرفة و المعلومات المخبأة ضمن هذا الكم الهائل من البيانات كالاستعلام عن الزبائن الذين لديهم عادات شرائية متماثلة أو التوقعات المحتلمة لبيع سمعة معينة في إحدى المناطق الجغرافية و غيرها من الاستعلامات الاستنتاجية و التي تعتمد على تقنية التنقيب في البيانات. و تتم عملية التنقيب بعدة أساليب من أهمها أسلوب العنقدة (التجميع) Clustering و الذي يتم بعدة خوارزميات. سوف نرّكز في بحثنا هذا على استخدام طريقة مدروسة لإيجاد المراكز الابتدائية لخوارزمية K-Medoids التي تقوم على مبدأ تقسيم البيانات إلى عناقيد كل عنقود يحوي بيانات متماثمة يَسهل التعامل معها بدلاً من اختيارها بالشكل العشوائي الذي يؤدي بدوره لظهور نتائج مختلفة وبطئ في تنفيذ الخوارزمية .