أوراق بحثية, رسائل ماجستير ودكتوراه حول الجنس

GFST: التدريب الذاتي المرشح للنوع الاجتماعي لمزيد من الدقة الجنس في الترجمة

391 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

وقد وجدت التقييمات المستهدفة أن أنظمة الترجمة الآلية غالبا ما تنتج بين الجنسين غير الصحيحين في الترجمات، حتى عندما يكون الجنس واضحا من السياق.علاوة على ذلك، هذه الترجمات الجنسية غير الصحيحة لديها القدرة على تعكس أو تضخيم التحيزات الاجتماعية.نقترح الت دريب الذاتي المرشح بين الجنسين (GFST) لتحسين دقة الترجمة من النوع الاجتماعي على المدخلات الجنسية التي لا لبس فيها.يستخدم نهج GFST لدينا مصدر أحادي طيور مصدر ونموذج أولي لإنشاء شركة موازية زائفة خاصة بالجنسين يتم تصفيتها ثم يتم إضافتها إلى بيانات التدريب.نقيم GFST على الترجمة من الإنجليزية إلى خمس لغات، ويجد أنها تحسن دقة الجنس دون إتلاف جودة عامة.نعرض أيضا صلاحية GFST على العديد من الإعدادات التجريبية، بما في ذلك إعادة التدريب من الصفر، والضبط الجميل، والتحكم في التوازن بين الجنسين للبيانات، والترجمة الأمامية، والترجمة الخلفي.

accurate gender gfst الجنس النوع الدقيق Gfst. صناعة حمض الفوسفور

`كن لطيفا لزوجتك!يتم إغلاق المطاعم ": هل يمكن للكشف عن التصنيف الجنساني بين الجنسين؟

435 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في هذه الورقة، نركز على اكتشاف خطاب الكراهية الجنسية ضد المرأة في تغريدات الدراسة لأول مرة تأثير الكشف عن التصنيف الجنساني حول التصنيف الجنساني.نقترح: (1) البيانات الأولى المشروحة للكشف عن النمط الجنساني، (2) طريقة جديدة لتعزيز البيانات بناء على تشاب ه الجملة مع مجموعات بيانات خارجية متعددة اللغات، و (3) مجموعة من تجارب التعلم العميق أولا للكشف عن القوالب النمطية الجنسانية ثم، لاستخدام هذه المهمة الإضافية للكشف عن الجنسين.على الرغم من أن وجود الصور النمطية لا ينطوي بالضرورة على المحتوى البغيض، إلا أن نتائجنا تظهر أن التصنيف الجنسي يمكن أن يستفيد بشكل نهائي من اكتشاف الصورة النمطية الجنسانية.

gender stereotype detection gender stereotype improve sexism classification كشف النمط الجنساني الصورة النمطية بين الجنسين تحسين تصنيف الجنس صناعة حمض الفوسفور المزيد..

NTUST-NLP-1 في Rocling-2021 المهمة المشتركة: نصوص تعليمية تحليل المعنويات الأبعاد باستخدام نماذج اللغة المحددة مسبقا

417 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يهدف هذا التقرير الفني إلى المهمة المشتركة في Rocling 2021: تحليل المعنويات الأبعاد للنصوص التعليمية.من أجل التنبؤ بالحالات العاطفية للنصوص التعليمية الصينية، نقدم إطارا عمليا من خلال توظيف نماذج اللغة المدربة مسبقا، مثل بيرت و Macbert.يمكن استخلاص ا لعديد من الملاحظات والتحليلات القيمة من سلسلة من التجارب.من النتائج، نجد أن الأساليب المستندة إلى Macbert يمكن أن توفر نتائج أفضل من الأساليب القائمة على BERT على مجموعة التحقق.لذلك، نحن متوسط نتائج التنبؤ بالعديد من النماذج التي تم الحصول عليها باستخدام إعدادات مختلفة كإخراج نهائي.

dimensional sentiment analysis texts dimensional sentiment تحليل المعنويات الأبعاد النصوص الأبعاد الجنس صناعة حمض الفوسفور

NCU-NLP في المهمة المشتركة Rocling-2021: باستخدام محولات Macbert لتحليل المعنويات الأبعاد

544 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نحن نستخدم محولات Macbert وضبطها بشكل جيد على المهام المشتركة Rocling-2021 باستخدام بيانات CVAT و CVAS.قارنا أداء ماكبيرت مع اثنين من المحولاتين الآخرين وروبرتا في الأبعاد الإثارة، على التوالي.تم استخدام معامل ماي والارتباط (ص) كمقاييس التقييم.على مج موعة اختبار Rocling-2021، يحقق نموذج Macbert المستخدم الخاص بنا 0.611 من MAE و 0.904 من R في أبعاد التكافؤ؛و 0.938 من ماي و 0.549 من ص في البعد الإثرا.

تحليل باستخدام بيرت dimensional sentiment الجنس الأبعاد صناعة حمض الفوسفور

NTUST-NLP-2 في Rocling-2021 المهمة المشتركة: محلل الدلالي القائم على بيرت مع معلومات مستوى الكلمات

635 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في هذه الورقة، اقترحنا محلل دلالي أبعاد بر فندقية، وهو مصمم من خلال دمج معلومات على مستوى Word.حقق نموذجنا ثلاثة من أفضل النتائج في أربعة مقاييس على rocling 2021 المهمة المشتركة: تحليل المعنويات الأبعاد للنصوص التعليمية ".أجرينا سلسلة من التجارب لمقا رنة فعالية مختلف الأساليب المدربة مسبقا.علاوة على ذلك، فإن النتائج تعاني أيضا على أن طريقتنا يمكن أن تحسن بشكل كبير من الأداء من الأساليب الكلاسيكية.استنادا إلى التجارب، ناقشنا أيضا تأثير هياكنات النموذج ومجموعات البيانات.

النصوص الأبعاد الجنس word-level information bert-based semantic analyzer معلومات مستوى الكلمات محلل الدلالي القائم على بيرت صناعة حمض الفوسفور

Rocling-2021 المهمة المشتركة: تحليل المعنويات الأبعاد للنصوص التعليمية

530 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تقدم هذه الورقة المهمة المشتركة 2021 على تحليل المشاعر الأبعاد للنصوص التعليمية التي تسعى إلى تحديد درجة المعنويات ذات القيمة الحقيقية لتعليقات التقييم الذاتي كتبها الطلاب الصينيين في كل من التكافؤ والأبعاد الإثراية.يمثل Valence درجة المشاعر اللطيفة وغير السارة (أو الإيجابية والسلبية)، وتمثل الإثريات درجة الإثارة والهدوء.من بين 7 فرق مسجلة لهذه المهمة المشتركة لتحليل المعنويات ثنائي الأبعاد، 6 نتائج مقدمة.نتوقع أن تنتج حملة التقييم هذه تقنيات تحليل المعنويات الأبعاد أكثر تقدما للمجال التعليمي.يتم إجراء جميع مجموعات البيانات مع معايير الذهب وتسجيل البرنامج النصي متاحا للباحثين.

الجنس الأبعاد صناعة حمض الفوسفور

التحقيق نماذج لغة متعددة اللغات للخطوط

493 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

أصبحت نماذج اللغة متعددة اللغات المدربة مسبقا كتلة مبنى مهمة في معالجة اللغة الطبيعية متعددة اللغات.في الورقة الحالية، نحقق في مجموعة من هذه النماذج لمعرفة مدى نقل المعرفة على مستوى الخطاب عبر اللغات.يتم ذلك بتقييم منهجي على مجموعة أوسع من مهام مستوى الخطاب مما تم تجميعه مسبقا.نجد أن عائلة XLM-Roberta من نماذج تظهر باستمرار أفضل أداء، من خلال نماذج أحادية جيدة جيدة في وقت واحد ومهينة القليل نسبيا في إعداد طلقة صفرية.تشير نتائجنا أيضا إلى أن التقطير النموذجي قد تؤذي قدرة النقل عبر اللغات من تمثيل الجملة، في حين أن الاختلاف اللغوي على الأكثر تأثير متواضع.نأمل أن يكون جناح اختبارنا، الذي يغطي 5 مهام مع ما مجموعه 22 لغة في 10 أسر متميزة، بمثابة منصة تقييم مفيدة للأداء متعدد اللغات في مستوى الجملة وما بعدها.

الجنس الأبعاد probing multilingual language multilingual natural language التحقيق لغة متعددة اللغات لغة طبيعية متعددة اللغات صناعة حمض الفوسفور

عنصر عنصري أو جنسي؟تصنيف الميمات وراء البغيض

624 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

الميمات هي مجموعات من النص والصور التي غالبا ما تكون روح الدعابة في الطبيعة.ولكن، قد لا يكون هذا هو الحال دائما، وقد تصور مجموعات معينة من النصوص والصور الكراهية، يشار إليها باسم الميمات البغيضة.يقدم هذا العمل خط أنابيب متعدد الوسائط يأخذ كل من الميز ات المرئية والنصية من الميمات إلى (1) تحديد الفئة المحمية (على سبيل المثال، الجنس، الجنس وما إلى ذلك) التي هاجمت؛و (2) اكتشاف نوع الهجوم (E.G. ازدراء، Slurs وما إلى ذلك).يستخدم خط أنابيبنا تمثيلا مرئيا ومرئيا تدريبا مسبقا مسبقا، متبوعا بتصنيف الانحدار اللوجستي البسيط.نحن نوظف خط أنابيبنا على مجموعة بيانات تحدي الميمات البغيضة مع ملصقات إضافية تم إنشاؤها حديثا عن الفئة المحمية ونوع الهجوم.يحقق أفضل نموذج لدينا AUROC من 0.96 لتحديد الفئة المحمية، و 0.97 للكشف عن نوع الهجوم.نطلق سرد علاماتنا في https://github.com/harisbinzia/hatefulmemes

racist or sexist sexist meme hateful memes عنصرية أو جنسية الجنس جنسي الميمات البغيضة صناعة حمض الفوسفور المزيد..

توليد البيانات المعززة بين الجنسين ل NLP

379 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

التحيز بين الجنسين هو حدوث متكرر في التطبيقات القائمة على البرامج الوطنية للتنمية الوطنية، وخاصة وضوحا باللغات التي يتم تنشيطها بين الجنسين. يمكن أن تظهر التحيز من خلال جمعيات بعض الصفات وتحريك الأسماء مع الجنس الطبيعي للإرازات، ولكن أيضا بسبب التردد ات الجنسانية النحوية غير الموازنة من الكلمات المصدرة. يصبح هذا النوع من التحيز أكثر وضوحا في توليد ينصوصات التحدث حيث لا يتم تحديد النوع الاجتماعي داخل الجملة، لأن معظم تطبيقات NLP الحالية لا تزال تعمل على سياق مستوى الجملة. كخطوة نحو NLP أكثر شمولية، تقترح هذه الورقة نهجا تلقائيا وعموما إعادة كتابة جمل محادثة قصيرة. يمكن تطبيق طريقة إعادة كتابة على الجمل التي، دون سياق خارجي، لديها بدائل مكافئة متعددة من حيث الجنس. يمكن تطبيق الطريقة على إنشاء مخرجات متوازنة بين الجنسين وكذلك لإنشاء بيانات تدريب متوازنة بين الجنسين. يعتمد النهج المقترح على نظام ترجمة آلية عصبية مدربة على ترجمة "من نوع جنسي إلى آخر. إظهار كل من التحليل الأوتوماتيكي واليدوي للنهج النتائج الواعدة فيما يتعلق بالجيل التلقائي من البدائل الجنسانية لجمل المحادثة باللغة الإسبانية.

gender augmented data generating gender augmented البيانات المعززة بين الجنسين توليد الجنس المعزز صناعة حمض الفوسفور

التحقيق في تأثير التمثيل الجنساني في بيانات تدريب ASR: دراسة حالة عن Libispeech

318 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في هذه الورقة نسأل عن تأثير التمثيل الجنساني في البيانات التدريبية على أداء نظام ASR المنتهي للنهاية.نقوم بإنشاء تجربة بناء على Corpus Librispeech و Build 3 تدريبات تدريبية مختلفة تختلف فقط نسبة البيانات التي تنتجها كل فئة جنسانية.نلاحظ أنه إذا كان ن ظامنا قوي بشكل عام على التوازن بين الجنسين أو عدم التوازن في البيانات التدريبية، إلا أنه يعتمد على الكفاية بين الأفراد الموجودين في مجموعات التدريب والاختبار.

التحيز في ويكيبيديا asr training data gender representation بيانات التدريب العصر تمثيل الجنس صناعة حمض الفوسفور

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد