ترغب بنشر مسار تعليمي؟ اضغط هنا

في هذه الدراسة، نقترح طريقة تعلم الإشراف على الذات التي تطبق تمثيلات معنى الكلمات في السياق من نموذج لغة ملثم مسبقا مسبقا. تعد تمثيلات الكلمات هي الأساس للدلالات المعجمية في السياق وتقديرات التشابه المنصوصية الدلالية غير المرفوعة (STS). تقوم الدراسة السابقة بتحويل التمثيلات السياقية التي تستخدم تضمين كلمة ثابتة لإضعاف الآثار المفرطة لمعلومات السياقية. على النقيض من ذلك، تستمد الأسلوب المقترح على تمثيلات كلمة معنى في السياق مع الحفاظ على معلومات السياق المفيدة سليمة. على وجه التحديد، تتعلم طريقةنا الجمع بين مخرجات الطبقات المخفية المختلفة التي تستخدم الانتباه عن الذات من خلال التعلم الذاتي الخاضع للإشراف مع كائن تدريب تلقائيا تلقائيا. لتقييم أداء النهج المقترح، أجرينا تجارب مقارنة باستخدام مجموعة من المهام القياسية. تؤكد النتائج أن تمثيلاتنا أظهرت أداء تنافسي مقارنة بسلطة حديثة من الأسلوب لتحويل التمثيلات السياقية للمهام الدلالية المعجمية السياقة وتفوقها على تقدير STS.
تمثيل المعنى التجريدي (AMR) هو لغة تمثيل معنى رسومي مصممة لتمثيل معلومات الاقتراح حول هيكل الوسيطة. ومع ذلك، فإنه غير قادر في الوقت الحاضر على تمثيل السياقات غير التابعة غير التابعة بشكل مرضي، وغالبا ما ترخيص الاستدلالات غير اللائقة. في هذه الورقة، ن ظهر كيفية حل مشكلة عدم اليريدية دون جاذبية الرسوم البيانية الطبقات من خلال رسم خرائط من AMRS في حساب التفاضل والتكامل Lambda المكتوبة ببساطة (STLC). على الأقل بالنسبة لبعض الحالات، يتطلب ذلك إدخال دور جديد: المحتوى الذي يعمل كمشغل متباين. الترجمة المقترحة مستوحاة من أدب اللغويات الرسمية في دلالات الأحداث في تقارير الموقف. بعد ذلك، نتعلم تفاعل نطاق الكمي والمشغلين المتهمين في غمائم دي / دي ديكتو المزعومة. نعتمد عقدة النطاق من الأدب وتوفير دلالات صريحة متعددة الأبعاد تستخدم تخزين كوبر يتيح لنا أن تستمد قراءات DE RE و De De Di Dicto بالإضافة إلى قراءات نطاق الوسيط والتي تثبت صعوبة في الحسابات دون عقدة نطاق.
إن التقاط معنى كلمة في السياق والتمييز بين المراسلات والاختلافات عبر اللغات هو مفتاح بناء نماذج تمثيل نصية متعددة اللغات والنجاح. ومع ذلك، فإن مجموعات بيانات التقييم المتعددة اللغات الحالية التي تقيم الدلالات المعجمية في السياق "لها قيود مختلفة. على وجه الخصوص، 1) تقتصر تغطيتها اللغوية على لغات الموارد العالية والانحساج لصالح سوى عدد قليل من الأسر والمناطق اللغوية، 2) تصميم يجعل المهمة قابلة للحل عبر الإشارات السطحية، والتي تؤدي إلى تضخم بشكل مصطنع (وأحيانا سوبر -Human) عروض التشفير المحددين، و 3) لا يوجد دعم للتقييم المتبادل اللغوي. من أجل معالجة هذه الثغرات، نقدم AM2ICO (المعنى الخصومة والتعدد اللغات في السياق)، مجموعة التقييم الواسع التغطية واللغات متعددة اللغات؛ يهدف إلى تقييم إدراج قدرة نماذج التمثيل الحديثة (SOTA) لفهم هوية معنى الكلمات في السياقات المتبادلة لمدة 14 أزواج لغوية. نقوم بإجراء سلسلة من التجارب في مجموعة واسعة من الإعدادات وإظهار الطبيعة الصعبة ل AM2ICO. تكشف النتائج أن تشفير سوتا الحالية التي يتعامل معها يتخلف بشكل كبير وراء الأداء البشري، ويتم ملاحظة أكبر فجوات لغات الموارد المنخفضة ولغات مختلفة عن اللغة الإنجليزية.
تقدم هذه الورقة نهجا جديدا للتعلم بزيادة المعنى بصريا تمثيل الكلمات باعتبارها تضمين عقدة منخفضة الأبعاد في التسلسل الهرمي في الرسم البياني الأساسي.المستوى الأدنى من عروض الكلمات التسلسل الهرمية الخاصة بالكلمة، مشروط إلى طريقة أخرى، من خلال الرسوم الب يانية المخصصة ولكن التواصل، في حين أن المستوى الأعلى يضع هذه التمثيلات معا على رسم بياني واحد لمعرفة التمثيل بالاشتراك من كل من الطرائق.طوبولوجيا كل طرازات الرسم البياني علاقات التشابه بين الكلمات، ويقدر بالاشتراك مع تضمين الرسم البياني.الافتراض الأساسي هذا النموذج هو أن الكلمات تقاسم معنى مماثل تتوافق مع المجتمعات في الرسم البياني الأساسي في مساحة منخفضة الأبعاد.لقد سمحنا على هذا النموذج التسلسل الهرمي تشابه الرسم البياني متعدد الوسائط (HM-SGE).تحقق النتائج التجريبية من صحة قدرة HM-SGE لمحاكاة أحكام التشابه البشري وتصنيف المفهوم، مما يتفوق على حالة الفن.
أصبح تمثيل المعنى الملخص (AMR) شعبية لتمثيل معنى اللغة الطبيعية في هياكل الرسم البياني.ومع ذلك، لا يمثل AMR معلومات النطاق، مما يشكل مشكلة في التعبير الشامل وعلى وجه التحديد من أجل الاستدلالات من البيانات المنفذة.هذا هو الحال مع ما يسمى بتفسير إيجابي "من البيانات المنفذة، والتي يتم تحديد معنى إيجابي ضمني من خلال استنتاج تركيز النفي.في هذا العمل، يمكننا التحقيق في كيفية تمثيل التفسيرات الإيجابية المحتملة (PPIS) في عمرو.نقترح بنية AMR ذات دوافع منطقية ل PPIS التي تجعل تركيز النفي صريحا ورسم اقتراحا أوليا لمنهجية منهجية لتوليد هذه الهيكل التعبيري.
تمثيل المعنى التجريدي (AMR) هو تمثيل معنى على مستوى الجملة بناء على هيكل الوسائد المسند.أحد التحديات التي نجدها في تحليل عمرو هي التقاط هيكل الجمل المعقدة التي تعبر عن العلاقة بين المسندات.إن معرفة الجزء الأساسي من هيكل الجملة مقدما قد يكون مفيدا في مثل هذه المهمة.في هذه الورقة، نقدم قائمة أنماط التبعية للإنشاءات الإنكليزية المجامعة المصممة لتحليل عمرو.مع مرحلة مانعة نمط مخصصة، يتم استرداد جميع حدوث إنشاءات الجملة المعقدة من جملة مدخلات.في حين أن بعض المسحاتين لديهم غموض دليون، فإننا نتعامل مع هذه المشكلة من خلال نماذج تصنيف التدريب على البيانات المستمدة من AMR و Wikipedia Corpus، وإنشاء خط أساس جديد للأعمال المستقبلية.سيتم الإعلان عن أنماط الجملة المجامعة المتقدمة وأوصاف عمرو المقابلة.
تقدم هذه الورقة وصف نظام فريق المحور، الذي يفسر العمل ذي الصلة والنتائج التجريبية لمشاركة فريقنا في مهمة Semeval 2021: الغموض المتعدد اللغات والتبلغة في السياق (MCL-WIC). بيانات هذه المهمة المشتركة هي أساسا بعض الزوجات الزوجية عبر اللغة أو متعددة الل غات. اللغات المشمولة في Corpus تشمل اللغة الإنجليزية والصينية والفرنسية والروسية والعربية. الهدف المهمة هو الحكم على ما إذا كانت الكلمات نفسها في أزواج هذه الجملة لها نفس المعنى في الجملة. يمكن اعتبار ذلك مهمة التصنيف الثنائي لأزواج الجملة. ما نحتاج إليه هو استخدام طريقتنا لتحديد بدقة قدر الإمكان معنى الكلمات في زوج الجملة هي نفسها أو مختلفة. يتكون النموذج المستخدم من قبل فريقنا بشكل أساسي من خوارزميات روبرتا و TF-IDF. مؤشر تقييم النتائج لتقديم المهمة هو درجة F1. شاركنا فقط في مهمة اللغة الإنجليزية. وكانت النتيجة النهائية لنتائج التنبؤ بمجموعة الاختبار المقدمة من فريقنا 84.60.
AMR (تمثيل المعنى التجريدي) و EDS (هياكل التبعية الابتدائية) هي تمثيلين لمعنى شعبيتين في NLP / NLU.AMR أكثر مجردة ومفاهيمية، في حين أن EDS هو أعلى مستوى منخفض، أقرب إلى الهياكل المعجمية للجمل المحددة.وبالتالي ليس من المستغرب أن تحليل EDS أسهل من تحلي ل عمرو.في هذا العمل، نفكر في استخدام معلومات من تحليل EDS للمساعدة في تحسين أداء تحليل عمرو.نعتمد محلل محلل ومقره انتقالي ويقترح بإضافة الرسوم البيانية EDS كيزات دلالة إضافية باستخدام تشفير رسم بياني يتكون من LSTM LETER وطبقة GCN.تبين نتائجنا التجريبية أن المعلومات الإضافية من تحليل EDS يعطي بالفعل دفعة إلى أداء محلل عمرو الأساسي المستخدمة في تجاربنا.
تقدم هذه الورقة المهمة المشتركة Semeval-2021 4: قراءة الفهم من معنى مجردة (Recam). تم تصميم هذه المهمة المشتركة للمساعدة في تقييم قدرة الآلات في تمثيل وفهم مفهوم مجردة. يتعين على النظام المقابل، من المتوقع أن يختار نظام المشاركة، الإجابة الصحيحة من خ مسة مرشحين من المفاهيم المجردة في الفهم مهام. بناء على اثنين من التعريفات النموذجية للمخراج، أي غير محسنة وغير محددة، توفر مهمتنا ثلاثة مجموعات فرعية لتقييم قدرة النماذج في فهم النوعين من المعنى التجريدي وتعميم النماذج. على وجه التحديد، يهدف فرقة فرعية 1 إلى تقييم مفاهيم نماذج النظام المشاركة التي لا يمكن أن ينظر إليها مباشرة في العالم المادي. يركز SubTask 2 على قدرة النماذج في فهم مفاهيم غير محددة تقع عالية في التسلسل الهرمي Hypernym نظرا لسياق مرور. يهدف SubTask 3 إلى توفير بعض الأفكار حول تعميم النماذج على النوعين من الممرضين. خلال فترة التقييم الرسمية SEMEVAL-2021، تلقينا 23 تقريرا إلى الفرعية 1 و 28 إلى الفريق الفرعي 2. قدمت الفرق المشاركة بالإضافة إلى ذلك 29 تقريرا إلى الفرع الفرعي 3. يمكن العثور على موقع المتصدرين ومواقع المنافسة في HTTPS: //competitions.codalab. ORG / المسابقات / 26153. تتوفر بيانات البيانات وخطوط الأساس في https://github.com/boyuanzheng010/semeval2021-Reading-comprehension-of-Abstract-meaning.
في تحليل التمثيل المعني المتبادل التجريدي (AMR)، يقوم الباحثون بتطوير النماذج التي تمارس طرزها من لغات مختلفة على الأمراض الأمريكية لالتقاط هياكلها الدلالية الأساسية: بالنظر إلى عقوبة بأي لغة، نهدف إلى التقاط المحتوى الدلالي الأساسي من خلال المفاهيم المتصلةأنواع متعددة من العلاقات الدلالية.الأساليب عادة ما تصل إلى بيانات التدريب الفضي الكبيرة لتعلم نموذج واحد قادر على مشروع الجمل غير الإنجليزية إلى AMRS.ومع ذلك، نجد أن خط الأساس البسيط يميل إلى التغاضي عنه: ترجمة الجمل إلى الإنجليزية وتستعرض AMR الخاص بهم مع محلل عمرو أحادي (ترجمة + تحليل، T + P).في هذه الورقة، نؤيد هذا الخط الأساسي البسيط من خطوتين، وتعزيزه بنظام NMT قوي ومحلل عمرو قوي.تظهر تجاربنا أن T + P يتفوق على نظام أحدث حديثة في جميع اللغات التي تم اختبارها: الألمانية والإيطالية والإسبانية وماندرين مع +14.6 و +12.6 و +14.3 ونقاط Smatch
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا