ترغب بنشر مسار تعليمي؟ اضغط هنا

وقد وجدت التقييمات المستهدفة أن أنظمة الترجمة الآلية غالبا ما تنتج بين الجنسين غير الصحيحين في الترجمات، حتى عندما يكون الجنس واضحا من السياق.علاوة على ذلك، هذه الترجمات الجنسية غير الصحيحة لديها القدرة على تعكس أو تضخيم التحيزات الاجتماعية.نقترح الت دريب الذاتي المرشح بين الجنسين (GFST) لتحسين دقة الترجمة من النوع الاجتماعي على المدخلات الجنسية التي لا لبس فيها.يستخدم نهج GFST لدينا مصدر أحادي طيور مصدر ونموذج أولي لإنشاء شركة موازية زائفة خاصة بالجنسين يتم تصفيتها ثم يتم إضافتها إلى بيانات التدريب.نقيم GFST على الترجمة من الإنجليزية إلى خمس لغات، ويجد أنها تحسن دقة الجنس دون إتلاف جودة عامة.نعرض أيضا صلاحية GFST على العديد من الإعدادات التجريبية، بما في ذلك إعادة التدريب من الصفر، والضبط الجميل، والتحكم في التوازن بين الجنسين للبيانات، والترجمة الأمامية، والترجمة الخلفي.
في هذه الورقة، نركز على اكتشاف خطاب الكراهية الجنسية ضد المرأة في تغريدات الدراسة لأول مرة تأثير الكشف عن التصنيف الجنساني حول التصنيف الجنساني.نقترح: (1) البيانات الأولى المشروحة للكشف عن النمط الجنساني، (2) طريقة جديدة لتعزيز البيانات بناء على تشاب ه الجملة مع مجموعات بيانات خارجية متعددة اللغات، و (3) مجموعة من تجارب التعلم العميق أولا للكشف عن القوالب النمطية الجنسانية ثم، لاستخدام هذه المهمة الإضافية للكشف عن الجنسين.على الرغم من أن وجود الصور النمطية لا ينطوي بالضرورة على المحتوى البغيض، إلا أن نتائجنا تظهر أن التصنيف الجنسي يمكن أن يستفيد بشكل نهائي من اكتشاف الصورة النمطية الجنسانية.
يهدف هذا التقرير الفني إلى المهمة المشتركة في Rocling 2021: تحليل المعنويات الأبعاد للنصوص التعليمية.من أجل التنبؤ بالحالات العاطفية للنصوص التعليمية الصينية، نقدم إطارا عمليا من خلال توظيف نماذج اللغة المدربة مسبقا، مثل بيرت و Macbert.يمكن استخلاص ا لعديد من الملاحظات والتحليلات القيمة من سلسلة من التجارب.من النتائج، نجد أن الأساليب المستندة إلى Macbert يمكن أن توفر نتائج أفضل من الأساليب القائمة على BERT على مجموعة التحقق.لذلك، نحن متوسط نتائج التنبؤ بالعديد من النماذج التي تم الحصول عليها باستخدام إعدادات مختلفة كإخراج نهائي.
نحن نستخدم محولات Macbert وضبطها بشكل جيد على المهام المشتركة Rocling-2021 باستخدام بيانات CVAT و CVAS.قارنا أداء ماكبيرت مع اثنين من المحولاتين الآخرين وروبرتا في الأبعاد الإثارة، على التوالي.تم استخدام معامل ماي والارتباط (ص) كمقاييس التقييم.على مج موعة اختبار Rocling-2021، يحقق نموذج Macbert المستخدم الخاص بنا 0.611 من MAE و 0.904 من R في أبعاد التكافؤ؛و 0.938 من ماي و 0.549 من ص في البعد الإثرا.
في هذه الورقة، اقترحنا محلل دلالي أبعاد بر فندقية، وهو مصمم من خلال دمج معلومات على مستوى Word.حقق نموذجنا ثلاثة من أفضل النتائج في أربعة مقاييس على rocling 2021 المهمة المشتركة: تحليل المعنويات الأبعاد للنصوص التعليمية ".أجرينا سلسلة من التجارب لمقا رنة فعالية مختلف الأساليب المدربة مسبقا.علاوة على ذلك، فإن النتائج تعاني أيضا على أن طريقتنا يمكن أن تحسن بشكل كبير من الأداء من الأساليب الكلاسيكية.استنادا إلى التجارب، ناقشنا أيضا تأثير هياكنات النموذج ومجموعات البيانات.
تقدم هذه الورقة المهمة المشتركة 2021 على تحليل المشاعر الأبعاد للنصوص التعليمية التي تسعى إلى تحديد درجة المعنويات ذات القيمة الحقيقية لتعليقات التقييم الذاتي كتبها الطلاب الصينيين في كل من التكافؤ والأبعاد الإثراية.يمثل Valence درجة المشاعر اللطيفة وغير السارة (أو الإيجابية والسلبية)، وتمثل الإثريات درجة الإثارة والهدوء.من بين 7 فرق مسجلة لهذه المهمة المشتركة لتحليل المعنويات ثنائي الأبعاد، 6 نتائج مقدمة.نتوقع أن تنتج حملة التقييم هذه تقنيات تحليل المعنويات الأبعاد أكثر تقدما للمجال التعليمي.يتم إجراء جميع مجموعات البيانات مع معايير الذهب وتسجيل البرنامج النصي متاحا للباحثين.
أصبحت نماذج اللغة متعددة اللغات المدربة مسبقا كتلة مبنى مهمة في معالجة اللغة الطبيعية متعددة اللغات.في الورقة الحالية، نحقق في مجموعة من هذه النماذج لمعرفة مدى نقل المعرفة على مستوى الخطاب عبر اللغات.يتم ذلك بتقييم منهجي على مجموعة أوسع من مهام مستوى الخطاب مما تم تجميعه مسبقا.نجد أن عائلة XLM-Roberta من نماذج تظهر باستمرار أفضل أداء، من خلال نماذج أحادية جيدة جيدة في وقت واحد ومهينة القليل نسبيا في إعداد طلقة صفرية.تشير نتائجنا أيضا إلى أن التقطير النموذجي قد تؤذي قدرة النقل عبر اللغات من تمثيل الجملة، في حين أن الاختلاف اللغوي على الأكثر تأثير متواضع.نأمل أن يكون جناح اختبارنا، الذي يغطي 5 مهام مع ما مجموعه 22 لغة في 10 أسر متميزة، بمثابة منصة تقييم مفيدة للأداء متعدد اللغات في مستوى الجملة وما بعدها.
الميمات هي مجموعات من النص والصور التي غالبا ما تكون روح الدعابة في الطبيعة.ولكن، قد لا يكون هذا هو الحال دائما، وقد تصور مجموعات معينة من النصوص والصور الكراهية، يشار إليها باسم الميمات البغيضة.يقدم هذا العمل خط أنابيب متعدد الوسائط يأخذ كل من الميز ات المرئية والنصية من الميمات إلى (1) تحديد الفئة المحمية (على سبيل المثال، الجنس، الجنس وما إلى ذلك) التي هاجمت؛و (2) اكتشاف نوع الهجوم (E.G. ازدراء، Slurs وما إلى ذلك).يستخدم خط أنابيبنا تمثيلا مرئيا ومرئيا تدريبا مسبقا مسبقا، متبوعا بتصنيف الانحدار اللوجستي البسيط.نحن نوظف خط أنابيبنا على مجموعة بيانات تحدي الميمات البغيضة مع ملصقات إضافية تم إنشاؤها حديثا عن الفئة المحمية ونوع الهجوم.يحقق أفضل نموذج لدينا AUROC من 0.96 لتحديد الفئة المحمية، و 0.97 للكشف عن نوع الهجوم.نطلق سرد علاماتنا في https://github.com/harisbinzia/hatefulmemes
التحيز بين الجنسين هو حدوث متكرر في التطبيقات القائمة على البرامج الوطنية للتنمية الوطنية، وخاصة وضوحا باللغات التي يتم تنشيطها بين الجنسين. يمكن أن تظهر التحيز من خلال جمعيات بعض الصفات وتحريك الأسماء مع الجنس الطبيعي للإرازات، ولكن أيضا بسبب التردد ات الجنسانية النحوية غير الموازنة من الكلمات المصدرة. يصبح هذا النوع من التحيز أكثر وضوحا في توليد ينصوصات التحدث حيث لا يتم تحديد النوع الاجتماعي داخل الجملة، لأن معظم تطبيقات NLP الحالية لا تزال تعمل على سياق مستوى الجملة. كخطوة نحو NLP أكثر شمولية، تقترح هذه الورقة نهجا تلقائيا وعموما إعادة كتابة جمل محادثة قصيرة. يمكن تطبيق طريقة إعادة كتابة على الجمل التي، دون سياق خارجي، لديها بدائل مكافئة متعددة من حيث الجنس. يمكن تطبيق الطريقة على إنشاء مخرجات متوازنة بين الجنسين وكذلك لإنشاء بيانات تدريب متوازنة بين الجنسين. يعتمد النهج المقترح على نظام ترجمة آلية عصبية مدربة على ترجمة "من نوع جنسي إلى آخر. إظهار كل من التحليل الأوتوماتيكي واليدوي للنهج النتائج الواعدة فيما يتعلق بالجيل التلقائي من البدائل الجنسانية لجمل المحادثة باللغة الإسبانية.
في هذه الورقة نسأل عن تأثير التمثيل الجنساني في البيانات التدريبية على أداء نظام ASR المنتهي للنهاية.نقوم بإنشاء تجربة بناء على Corpus Librispeech و Build 3 تدريبات تدريبية مختلفة تختلف فقط نسبة البيانات التي تنتجها كل فئة جنسانية.نلاحظ أنه إذا كان ن ظامنا قوي بشكل عام على التوازن بين الجنسين أو عدم التوازن في البيانات التدريبية، إلا أنه يعتمد على الكفاية بين الأفراد الموجودين في مجموعات التدريب والاختبار.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا