ترغب بنشر مسار تعليمي؟ اضغط هنا

الحوسبة عالية الأداء وتقنياتها

HPC: High Performance Computing

1188   0   37   0 ( 0 )
 تاريخ النشر 2018
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل omar altayyan




اسأل ChatGPT حول البحث

يقوم هذا البحث على دراسة اخر التطورات والاحداث في مجال الحوسبة عالية الأداء، والتي تقوم على توفير البنية التحتية والبيئة المناسبة والمستلزمات العتادية والبرمجية، مما يسمح بحل المسائل والرياضية والبيولوجية وتدريب نماذج الذكاء الاصطناعي والقيام بمحاكاة الظواهر الفيزيائية وغيرها من المسائل العملية الهامة التي تساهم بدفع عجلة التطور العملي بشكل مباشر

المراجع المستخدمة
nvidia.com/en-us/titan/titan-xp
developer.nvidia.com/cuda-zone
open-mpi.org
devblogs.nvidia.com/introduction-cuda-aware-mpi
en.wikipedia.org/wiki/IBM_Roadrunne
Quang, Daniel, Yifei Chen, and Xiaohui Xie. "DANN: a deep learning approach for annotating the pathogenicity of genetic variants." Bioinformatics 31.5 (2014): 761-763.
Abadi, Martín, et al. "Tensorflow: Large-scale machine learning on heterogeneous distributed systems." arXiv preprint arXiv:1603.04467 (2016).
Chen, Tianqi, et al. "Mxnet: A flexible and efficient machine learning library for heterogeneous distributed systems." arXiv preprint arXiv:1512.01274 (2015).
Jia, Yangqing, et al. "Caffe: Convolutional architecture for fast feature embedding." Proceedings of the 22nd ACM international conference on Multimedia. ACM, 2014.
computing.llnl.gov/tutorials/mpi
قيم البحث

اقرأ أيضاً

حقق محول ومتغيراتها نجاحا كبيرا في معالجة اللغة الطبيعية.نظرا لأن طرازات المحولات ضخمة الحجم، فإن خدمة هذه النماذج هي تحديا للتطبيقات الصناعية الحقيقية.في هذه الورقة، نقترح، مكتبة الاستدلال عالية الكفاءة للنماذج في عائلة المحولات.يتضمن سلسلة من تقنيا ت تحسين GPU لكلا من تبسيط حساب طبقات المحولات وتقليل بيانات الذاكرة.يدعم النماذج المدربة باستخدام Pytorch و Tensorflow.النتائج التجريبية على معايير الترجمة الآلية القياسية تظهر أنها تحقق تصل إلى 14x تسريع مقارنة مع Tensorflow وتسريع 1.4x مقارنة مع تنفيذ CUDA المتزامن.سيتم إصدار الرمز علنا بعد المراجعة.
تصف الورقة توضيحات TENTRANS إلى المهمة المشتركة ل WMT 2021 المشتركة.نستكشف تدريب مجموعة متنوعة من نماذج محولات الصغار الأصغر باستخدام إعداد المعلمين - طالب.يتم تدريب نموذجنا من خلال منصة تدريب متعددة اللغات المتطورة ذاتية اللغات ذاتية اللغويةونحن نطل ق أيضا مجموعة أدوات الاستدلال عالية الأداء مفتوح المصدر لنماذج المحولات والمكتب في C ++ بالكامل.يتم بناء جميع التحسينات الإضافية على رأس محرك الاستدلال بما في ذلك التخزين المؤقت للانتباه، نواة الانصهار، والتوقف المبكر، والعديد من التحسينات الأخرى.في عمليات التقديمات الخاصة بنا، يمكن أن يترجم الأسرع النظام الأسرع أكثر من 22000 رموز في الثانية مع TESLA P4 واحدة مع الحفاظ على 38.36 بلو على EN-DE NEWSTEST2019.تتوفر نماذجنا المدربة ومزيد من التفاصيل في أمثلة المنافسة التي تخدمها Tentrans.
تعتمد معظم خوارزميات التوقيع الرقمي الحالية في بنيتها على مفاهيم رياضية معقدة يتطلب تنفيذها وقتاً طويلاً و جيداً حسابياً كبيرا. و كمحاولة للتخفيف من هذه المشاكل اقترح بعض الباحثون خوارزميات توقيع رقمي تعتمد على توابع و عمليات حسابية بسيطة سريعة التنفيذ، إلا أن ذلك كان على حساب الأمان.
الحوسبة الكمومية، كأداة واعدة لحل المسائل المستحيلة في الحوسبة التقليدية نظراً لتعقيدها الأسي، مزاياها الخارقة، معيقاتها، أدواتها الفيزيائية والبرمجية، بالإضافة للوضع الراهن ورءيا مستقبلية

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا