ترغب بنشر مسار تعليمي؟ اضغط هنا

يهدف البحث إلى تقديم دراسة مرجعيّة مفصلة عن استخدام الشبكات العصبونية الإلتفافية (CNNs) في استخراج الميزات (Features) من الصور. وسيتطرق البحث إلى التعريف بمعنى الميزات (Features) الخاصة بالصور وأهميتها في تطبيقات معالجة الصورة. وسيتم أيضاً التعريف بالشبكات العصبونية الإلتفافية (CNNs) وبنيتها و طريقة عملها وأنواع المقاربات والمنهجيات المستخدمة في تدريبها لاستخراج الميزات (Features) من الصور.
إعادة تشكيل وضعيات الإنسان ثلاثية الأبعاد من صورة واحدة ثنائية الأبعاد هي مشكلة تمثل تحديا للعديد من الباحثين. وفي السنوات الأخيرة، كان هناك اتجاه صاعد نحو تحليل الهندسة ثلاثية الأبعاد للكائنات بما في ذلك الأشكال والوضع بدلاً من مجرد تقديم مربعات مر بوطة. حيث أن التفكير الهندسي ثلاثي الأبعاد يؤدي إلى توفير معلومات أكثر ثراءً عن المشهد لمهام لاحقة عالية المستوى مثل فهم المشهد والواقع المعزز والتفاعل مع الكمبيوتر البشري، بالإضافة أيضًا تحسين اكتشاف الكائنات [3]، [4]. ولذلك كانت إعادة التشكيل ثلاثية الأبعاد مشكلة مدروسة جيداً، وكانت هناك العديد من التقنيات القابلة للتطبيق عمليًا مثل البنية من الحركة، والأنظمة الصوتية متعددة المقاييس ومستشعرات العمق، ولكن هذه التقنيات محدودة في بعض السيناريوهات. هنا في هذه الورقة، نعرض كيف تم التعامل مع المشكلة في العقود القليلة الماضية، وتحليل التطورات الأخيرة في هذا المجال، والاتجاهات المحتملة للبحث في المستقبل.
حققت خوارزمية التعلم العميق مؤخرًا الكثير من النجاح خاصة في مجال رؤية الكمبيوتر.يهدف البحث الحالي إلى وصف طريقة التصنيف المطبقة على مجموعة البيانات الخاصة بأنواع متعددة من الصور (صور الرادار ذي الفجوة المركبةSAR والصور ليست SAR) ، أستخدم نقل التعلم م تبوعًا بأساليب الضبط الدقيق في مخطط التصنيف هذا . تم استخدام بنيات مدربة مسبقًا على قاعدة بيانات الصور المعروفهImageNet، تم استخدام نموذج VGG 16 بالفعل كمستخرج ميزات وتم تدريب مصنف جديد بناءً على الميزات المستخرجة .تركز بيانات الإدخال بشكل أساسي على مجموعة البيانات التي تتكون من خمس فئات فئة صور الرادارSAR (المنازل) وفئات الصور ليستSAR (القطط والكلاب والخيول والبشر). تم اختيار الشبكة العصبية التلافيفية (CNN) كخيار أفضل لـعملية التدريب لانها نتجت عن دقة عالية. لقد وصلنا إلى الدقة النهائية بنسبة 91.18٪ في خمس فئات مختلفة. تتم مناقشة النتائج من حيث احتمالية الدقة لكل فئة في تصنيف الصورة بالنسبة المئوية. تحصل فئة القطط على 99.6٪ ، بينما تحصل فئة المنازل على 100٪ وتحصل انواع آخرى من الفئات بمتوسط درجات 90٪ وما فوق.
يهدف المشروع في المقام الأول إلى توظيف الذكاء الاصطناعي ، وتحديداً مهارات برمجة شبكة عصبية حيث الشبكات العصبية بدورها هي شبكات مهتمة بالتدريب والتعلم من الخطأ ، وتوظيف هذا الخطأ لتحقيق أفضل النتائج. (CNN) على وجه الخصوص هي واحدة من أهم الشبكات العص بية التي تعالج مشاكل وقضايا التصنيف. وبالتالي فإن هذا المشروع يهدف إلى تصميم شبكة عصبية التفافية تصنف المركبات إلى عدة أنواع حيث سنقوم بتصميم الشبكة وتدريبها على قاعدة البيانات حيث أن قاعدة البيانات تتضمن صورًا لأنواع متعددة من المركبات وستقوم الشبكة بتصنيف كل صورة إلى نوعها ، بعد تعديل الصور وإجراء التغييرات المناسبة وتحويلها إلى اللون الرمادي واكتشاف الحواف والخطوط وبعد أن تصبح الصور جاهزة تبدأ عملية التدريب وبعد انتهاء عملية التدريب سنخرج بنتائج التصنيف وبعدها اختبار بمجموعة جديدة من الصور ومن اهم تطبيقات هذا المشروع الالتزام برصف السيارات والشاحنات والمركبات بشكل عام وكأن صورة تم ادخالها كسيارة لعينة السيارة وهي شاحنة ، على سبيل المثال ، سيعطي هذا خطأ حيث ستكتشف الشبكة ذلك من خلال فحصها وتصنيفها. كشاحنة ، نكتشف أن هناك انتهاكًا لقوانين الرصف
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا