ترغب بنشر مسار تعليمي؟ اضغط هنا

تصف هذه الورقة أنظمة الترجمة الآلية العصبية MiningLamp لمهام الترجمة الأخبار WMT2021.لقد شاركنا في ثمانية اتجاهات مهام ترجمة لنص الأخبار بما في ذلك الصينية من / الإنجليزية، الهوسا من / إلى الإنجليزية، الألمانية من / إلى / اللغة الإنجليزية والفرنسية م ن / إلى الألمانية.استند نظامنا الأساسي إلى بنية المحولات، مع بناء أوسع أو أصغر لمهام ترجمة أخبار مختلفة.استخدمنا بشكل رئيسي طريقة الترجمة الخلفي، وقراءة المعرفة والضبط بشكل جيد لتعزيز نموذج واحد، في حين تم استخدام الفرقة للجمع بين النماذج الفردية.احتل تقديمنا النهائي الأول لأول مرة في مهمة Hausa.
شاركنا في جميع المسارات لمهمة الترجمة الآلية ل WMT 2021: وحدة المعالجة المركزية ذات CPU أحادية النواة، وحدة المعالجة المركزية متعددة النواة، وأجهزة GPU مع شروط الإنتاجية والكمولية.تجمع تقاريرنا العديد من استراتيجيات الكفاءة: تقطير المعرفة، وحدة فك تر ميز وحدة بسيطة متكررة بسيطة (SSRU) مع طبقتين أو طبقتين، بقلين من المعجمين، وتنسيقات عدودية أصغر، وتقليم.بالنسبة لمسار وحدة المعالجة المركزية، استخدمنا طرازات 8 بت كمية.بالنسبة لمسار GPU، جربنا أعداد صحيحة FP16 و 8 بت في عشرات الموانئ.بعض عمليات التقديمات لدينا تحسين الحجم عبر سجل سجل 4 بت وحذف قائمة مختصرة معجمية.لقد مددنا تشذيم أكبر أجزاء من الشبكة، مع التركيز على تشذيب المكونات ومستوى الحظر الذي يحسن في الواقع السرعة على عكس تقليم المعامل الحكيم.
تصف هذه الورقة تقديم مختبر Tencent AI المهمة المشتركة WMT2021 على الترجمة الطبية الحيوية في ثمانية اتجاهات اللغة: الإنجليزية والألمانية والفرنسية والفرنسية والإنجليزية والإسبانية والإنجليزية الروسية.استغلنا بديكنات محولات مختلفة واستراتيجيات الترجمة المرجانية وتحسينها لتحسين جودة الترجمة.بشكل ملموس، نستكشف MBART (ليو وآخرون، 2020) لإظهار فعالية استراتيجية الاحتجاج.تحتل إرسال طلباتنا (Tencent AI Lab Machine Translation، TMT) باللغة الألمانية / الفرنسية / الإسبانية⇒إنجللوي على التوالي وفقا لنتائج التقييم الرسمي من حيث درجات بلو.
تصف هذه الورقة أنظمة الترجمة الآلية العصبية Niutrans لمهام الترجمة من الأخبار WMT 2021.لقد جعلنا التقديمات إلى 9 اتجاهات لغة، بما في ذلك محاميات اللغة الإنجليزية، اليابانية والروسية والأيسلندية والأيسلندية والإنجليزية.بنيت أنظمتنا الأساسية على العديد من المتغيرات الفعالة من المحولات، على سبيل المثال، محول DLCL، ODE-Transformer.نحن نستخدم أيضا الترجمة مرة أخرى، وقطاع المعرفة، وتقنيات ما بعد الفرقة، والتقنيات الدقيقة للتكرار لتعزيز الأداء النموذجي كذلك.
في هذه الورقة، نظهر أن الأسئلة والأجوبة التي تم إنشاؤها تلقائيا يمكن استخدامها لتقييم جودة أنظمة الترجمة الآلية (MT).بناء على العمل الحديث على تقييم تلخيص نص مبيعات، نقترح مقياس جديد لتقييم MT على مستوى النظام، ومقارنته بالحلول الأخرى الأخرى، وإظهار متانة لها من خلال إجراء تجارب لمختلف اتجاهات MT.
تقدم هذه الورقة بيانات عن تصورات تدريب المتدربين في عملية MTPE وآثار التدريب على التدريب في هذا المجال.تهدف هذه الدراسة إلى تحليل أداء المتدربين في ثلاثة مهام MTPE الزوجية باللغة الإنجليزية البولندية ومقابلات ما بعد المهام لتحديد الحاجة إلى تعزيز مها رات تحرير الترجمة الآلية في تثقيف طلاب الترجمة.نظرا لأن القليل جدا من المعلومات المتعلقة بتدريب MTPE متاح، فقد يتم العثور على هذه الدراسة مفيدة.
تحتاج أنظمة الإنتاج NMT عادة إلى خدمة مجالات المتخصصة التي لا تغطيها كوربيا كبيرة ومتاحة بسهولة بشكل مناسب.ونتيجة لذلك، غالبا ما يكون الممارسون نماذج غرضا عاما نماذج عامة على كل من المجالات التي يلبيها منظمةها.ومع ذلك، يمكن أن يصبح عدد المجالات كبيرا ، مما يتجمع مع عدد اللغات التي تحتاج إلى خدمة يمكن أن تؤدي إلى وضع أسطول غير قابل للحل من النماذج والمحافظة عليها.نقترح علامات متعددة الأبعاد، وهي طريقة لضبط نموذج NMT واحد على عدة مجالات في وقت واحد، وبالتالي تقليل تكاليف التطوير والصيانة بشكل كبير.نحن ندير تجارب حيث يقارن نموذج واحد MDT بشكل إيجابي لمجموعة من نماذج SOTA متخصصة، حتى عند تقييمها على المجال كانت تلك الأساس التي تم ضبطها بشكل جيد.إلى جانب بلو، نبلغ عن نتائج التقييم البشري.تعيش نماذج MDT الآن في Booking.com، مما يؤدي إلى تشغيل محرك MT الذي يخدم ملايين الترجمات يوميا في أكثر من 40 لغة مختلفة.
هناك دلالات شائعة مشتركة عبر النصوص والصور.بالنظر إلى الجملة في لغة مصدر، ما إذا كان يصور المشهد المرئي يساعد الترجمة في لغة مستهدفة؟تتطلب طرق ترجمة الآلات العصبية متعددة الوسائط المتعددة (MNMT) ثلاثة توائم من جملة ثنائية اللغة - صورة للتدريب وشرائط جملة المصدر - صورة للاستدلال.في هذه الورقة، نقترح عليلة، وهي طريقة ترجمة جاهزة عبر الخيال البصري.تخيل أولا تعلم توليد التمثيل المرئي من الجملة المصدر، ثم يستخدم كل من الجملة المصدر والتمثيل المتخيل "" لإنتاج ترجمة هادفة.على عكس الأساليب السابقة، فإنه يحتاج فقط إلى الجملة المصدر في وقت الاستدلال.توضح التجارب التي تخيل أن تخيل الفوائد من الخيال البصري وتتفوق بشكل كبير على خطوط خطوط الترجمة الآلية العصبية النصية فقط.يكشف المزيد من التحليل أن عملية الخيال في تخيل يساعد في ملء المعلومات المفقودة عند تنفيذ استراتيجية التدهور.
أهداف المحاذاة الكامنة مثل CTC والفأس تحسن بشكل كبير نماذج الترجمة الآلية غير التلقائي.هل يمكنهم تحسين النماذج التلقائية أيضا؟نستكشف إمكانية تدريب نماذج الترجمة الآلية ذات الجهاز التلقائي بأهداف محاذاة كامنة، ومراقبة ذلك، في الممارسة العملية، ينتج هذ ا النهج نماذج التدهور.نحن نقدم شرحا نظريا لهذه النتائج التجريبية، وأثبت أن أهداف المحاذاة الكامنة غير متوافقة مع إجبار المعلم.
في هذا العمل، نقدم طريقة لاختيار المحتوى وتخطيط المستندات للأخبار الآلية وتوليد التقارير من البيانات الإحصائية المهيكلة مثل تلك التي تقدمها الوكالة الإحصائية للاتحاد الأوروبي، يوروستات.هذه الطريقة مدفوعة بالبيانات وهي موضوع كبير مستقلة داخل مجال مجمو عة البيانات الإحصائية.نظرا لأن نهجنا لا يعتمد على التعلم الآلي، فهو مناسب لإدخال أتمتة الأخبار إلى مجموعة واسعة من المجالات حيث لا توجد بيانات تدريبية متاحة.على هذا النحو، فإنه مناسب كتكلفة منخفضة (من حيث جهود التنفيذ) خط الأساس له هيكلة المستند قبل إدخال المعرفة الخاصة بالمجال.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا