في هذه الورقة، نقوم بتحليل المدى الذي يتطلع إليه المعنى السياقي، أي شعور بمعنى تم حسابه على أساس مدمج الكلمات السياقية، قابلة للتحويل عبر اللغات. في هذه الغاية، جمعنا معيارا موحدا عبر اللغات ل Disambiguation Sense.بعد ذلك نقترح استراتيجيتين بسيطة لنق
ل المعرفة الخاصة بالمعنى بالمعنى بين اللغات واختبرها على النتائج المعدية-portform unolingual تمثيلات mernessnfrom البيانات الخاصة باللغة الحالية.
أصبحت الترجمة المرجودة (BT) واحدة من مكونات الأمر الواقع في الترجمة الآلية العصبية غير المنشأة (UNMT)، ويجعل صراحة لديها القدرة على الترجمة. ومع ذلك، يتم التعامل مع جميع النصوص الثنائية الزائفة التي تم إنشاؤها بواسطة BT بنفس القدر كبيانات نظيفة أثناء
التحسين دون النظر في تنوع الجودة، مما يؤدي إلى التقارب البطيء وأداء الترجمة المحدود. لمعالجة هذه المشكلة، نقترح طريقة تعلم المناهج الدراسية للاستفادة تدريجيا من النصوص الثنائية الزائفة القائمة على جودتها من التعبيات المتعددة. على وجه التحديد، نقوم أولا بتطبيق تضمين كلمة crosslingual لحساب صعوبة الترجمة المحتملة (الجودة) للجمل الأولية. بعد ذلك، يتم تغذية الجمل في برنامج التعريف الخاص ب UNMT من السهل إلى الدفعة الصلبة عن طريق الدفعة. علاوة على ذلك، بالنظر إلى جودة الجمل / الرموز في دفعة معينة هي متنوعة أيضا، فإننا نتخذ النموذج نفسه لحساب درجات الجودة المحبوبة بشكل جيد، والتي يتم تقديمها كعامل تعليمي لموازنة مساهمات أجزاء مختلفة عند فقد الحوسبة وتشجيعها نموذج UNMT للتركيز على البيانات الزائفة بجودة أعلى. النتائج التجريبية على WMT 14 EN-FR، WMT 14 EN-DE، WMT 16 EN-RO، و LDC EN-ZH توضح أن الطريقة المقترحة تحقق تحسينات ثابتة مع سرعة التقارب الأسرع.
أصبحت الأنظمة الخاضعة للإشراف في الوقت الحاضر وصفة قياسية ل disambiguation شعور النصوص (WSD)، مع طرازات اللغة القائمة على المحولات كعنصرها الأساسي. ومع ذلك، في حين أن هذه الأنظمة قد تحققت بالتأكيد عروض غير مسبوقة، فإن جميعها تعمل تقريبا في ظل افتراض
التقييد، بالنظر إلى سياق، يمكن إزالة كل كلمة بشكل فردي دون أي حساب من الخيارات الأخرى بالمعنى. لمعالجة هذا القيد وإسقاط هذا الافتراض، نقترح الفهم المعنى المستمر (CONSEC)، ونهج جديد في WSD: الاستفادة من إعادة تأكيد مؤخرا لهذه المهمة كمحالة استخراج النص، نحن نتكيافقها على صياغةنا وإدخال حلقة ردود الفعل الاستراتيجية التي تسمح بالغزانة للكلمة المستهدفة لا تتضمن فقط في سياقها ولكن أيضا على الحواس الصريحة المخصصة للكلمات القريبة. نقيم Consec وفحص كيف تقود مكوناتها إلى تجاوز جميع منافسيها وتحديد حالة من الفن الجديد على WSD الإنجليزية. نستكشف أيضا كيفية فرايس Consec في الإعداد المتبادل اللغوي، مع التركيز على 8 لغات مع درجات مختلفة من توفر الموارد، وإبلاغ تحسينات كبيرة على النظم السابقة. نطلق سردنا في https://github.com/sapienzanlp/consec.
الرسوم البيانية المعرفة ضرورية للعديد من تطبيقات معالجة اللغة الطبيعية المصب، ولكنها غير مكتملة عادة مع العديد من الحقائق المفقودة. ينتج عن هذا الجهود البحثية في مهمة التفكير المتعدد القفزات، والتي يمكن صياغة كعملية بحث ونماذج حالية تؤدي عادة منطق بع
يد المنال. ومع ذلك، فإن السبب البعيد الطويل أمر حيوي أيضا بالقدرة على توصيل الكيانات غير المرتبطة بسطحية. بأفضل من علمنا، يفتقر إلى وجود إطار عام يقترب من التفكير المتعدد القفز في سيناريوهات التفكير المسؤولة لفترة طويلة مختلطة. نقول أن هناك مشكلتان رئيسيتان لنموذج التفكير المتعدد القفز العام: ط) أين تذهب، والثاني) عند التوقف. لذلك، نقترح نموذج عام يحدد المشكلات ذات ثلاث وحدات: 1) وحدة المعرفة المحلية المحلية لتقدير المسارات المحتملة، 2) وحدة التسرب الإجراءات المختلفة لاستكشاف مجموعة متنوعة من المسارات، و 3) التوقف التكيفي وحدة البحث لتجنب البحث عنها. توضح النتائج الشاملة على ثلاث مجموعات بيانات تفوق نموذجنا مع تحسينات كبيرة ضد خطوط الأساس في سيناريوهات التفكير المسافة القصيرة والطويلة.
تقدم هذه الورقة نهجا جديدا للتعلم بزيادة المعنى بصريا تمثيل الكلمات باعتبارها تضمين عقدة منخفضة الأبعاد في التسلسل الهرمي في الرسم البياني الأساسي.المستوى الأدنى من عروض الكلمات التسلسل الهرمية الخاصة بالكلمة، مشروط إلى طريقة أخرى، من خلال الرسوم الب
يانية المخصصة ولكن التواصل، في حين أن المستوى الأعلى يضع هذه التمثيلات معا على رسم بياني واحد لمعرفة التمثيل بالاشتراك من كل من الطرائق.طوبولوجيا كل طرازات الرسم البياني علاقات التشابه بين الكلمات، ويقدر بالاشتراك مع تضمين الرسم البياني.الافتراض الأساسي هذا النموذج هو أن الكلمات تقاسم معنى مماثل تتوافق مع المجتمعات في الرسم البياني الأساسي في مساحة منخفضة الأبعاد.لقد سمحنا على هذا النموذج التسلسل الهرمي تشابه الرسم البياني متعدد الوسائط (HM-SGE).تحقق النتائج التجريبية من صحة قدرة HM-SGE لمحاكاة أحكام التشابه البشري وتصنيف المفهوم، مما يتفوق على حالة الفن.
في لغات parataxis مثل الصينية، يتم بناء معاني الكلمات باستخدام تكوينات كلمات محددة، والتي يمكن أن تساعد في إزالة حواس الكلمات.ومع ذلك، نادرا ما يتم استكشاف هذه المعرفة في أساليب Disambiguation Sense (WSD) السابقة.في هذه الورقة، نقترح نفايات المعرفة ب
تكوين النصوص لتعزيز WSD الصيني.نحن أولا بناء مجموعة بيانات WSD الصينية على نطاق واسع مع تكوينات الكلمات.بعد ذلك، نقترح نموذج صيغة نموذجية لإدماج تكوين الكلمات بشكل صريح في حالة إزالة الغموض.لتعزيز التعميم، نقوم بتصميم وحدة تنقية تكوين كلمة في حالة تعويض تكوين كلمة غير متوفرة.تظهر النتائج التجريبية أن طريقتنا تجلب تحسن كبير في الأداء على خطوط خطوط خطوط خطوط طويلة.
لقد حقق مجال NLP تقدما كبيرا في بناء تعويضات المعنى.ومع ذلك، تم تجاهل جانب مهم من المعنى اللغوي، والمعنى الاجتماعي، إلى حد كبير.نقدم مفهوم المعنى الاجتماعي ل NLP ومناقشة كيفية إبلاغ رؤى Sociolinguics بالعمل على التعلم في التمثيل في NLP.نحدد أيضا التحديات الرئيسية لهذا الخط الجديد من البحث.
يحاول هذا البحث أن يركز بالدراسة على مفهوم الدلالة, عند الفيلسوف الفرنسي جاك دريدا و سعيه إلى تقديم ممارسة نقدية مختلقة لمفهوم الدلالة, منشغلاً بالسؤال و البحث عن أفاق مختلفة للممارسة النقدية المتجاوزة للاتغلاق البنيوي. من خلال استراتيجية القراءة الت
ي تتيح المجال لإنفتاح النص و تعدديته. فيعرض بداية توضيح مفهوم الدلالة كما حدده دريدا. ثم يناقش دور القارئ بوصفه استراتيجية حاسمة في توليد الدلالة, كونه منتجاً للنص, و قدرته على استعادة ذاكرة النص اختلافاً. ليصل إلى تبيان التباعد بين النصوص الذي يخلقه مفهوم الفضاء النصيَّ, على اعتبار أنَّ دوره لا يقتصر على دلالة القوة تشتيتاً أو مغايرة فحسب, بل يحتوي أيضاً على حافز تكويني. إذ عبر ملاحقة الأثر و استحضار المستبعد تتولد الدلالة, و تخلق المتعة بين النصوص. و تالياً, تصبح القراءة تجربة جمالية تعيد تشكليل النص من جديد. ليخلص إلى تكثيف نتائجه في خاتمة تعرض بعض ما توصلنا إليه من أفكار في تناولنا لهذا الموضوع.
يَبْقَى ضَبْطُ الْمَعْنَى وَ الْوُصُوْلُ إِلَيْهِ غاية كُلِّ بَاْحِثٍ فِي اللُّغَةِ، وَ مَاْ دَاْمَ الْمَعْنَى هُوَ نِتَاْج التَّرْكِيْبِ النَّحْوِيِّ فِيْ مَقَاْمٍ مُعَيَّنٍ، لَاْ بُدَّ لِذَلِكَ الْبَاْحِثِ أَلَّا يُقْصِيَ أَحَدَهُمَاْ عَلَى حِسَاْب
ِ الْآخَرِ؛ أَيْ: تَدْخُلُ كُلٌّ مِنَ الْعَنَاْصِرِ النَّحْوِيَّةِ وَ الْعَنَاْصِرِ الدِّلَاْلِيَّةِ فِي عَلَاْقَةٍ جَدَلِيَّةٍ فِي تَفْسِيْرِ الْمَعْنَى.
وَ مِنْ هُنَاْ تَنَاْوَلْتُ فِي هَذَا الْبَحْثِ مَفْهُوْمَ مُقْتَضَى الْحَاْلِ وَ الْمُصْطَلَحَاْتِ الْمُتَعَلِّقَة بِهِ، وَ بَيَاْنَ فَاْعِلِيَّتِهِ فِي الْحَقْلِ اللُّغَوِيِّ، وَ أَثَرَ الْعَاْمِلِ الدِّيْنِيِّ فِيْ لَفْتِ أَنْظَاْرِ الْعُلَمَاْءِ الْقُدَاْمَى إِلَى أَهَمِّيَّةِ كُلٍّ مِنَ الشَّكْلِ النَّحْوِيِّ وَ الْمَقَاْمِ الَّذِيْ أَنْتَجَهُ، وَ مَدَى اعْتِمَاْدِ عُلَمَاْئِنَا الْقُدَاْمَى عَلَيْهِمَاْ وَ هُمْ يُفَسِّرُوْنَ النُّصُوْصَ الْقُرْآنِيَّةَ وَ الشَّوَاْهِدَ الشِّعْرِيَّةَ وَ يَسْتَخْرِجُوْنَ الْقَواْعِدَ مِنْهَاْ.
يسعى هذا البحث إلى معالجة إشكاليّة اتّهام ابن وهب الكاتب أبا عثمان الجاحظ بأنّه لم يعطِ البيان حقّه, و لم يدرسه دراسة كافية, فزعم استكمال النّقص من خلال دراسته أوجه البيان دراسة مفصلة الّتي تتشابه إلى حدّ كبير مع أوجه البيان عند أبي عثمان الّذي أشار
إلى أهميّة العلاقة بين اللفظ و المعنى و ضرورة التّناسب بينهما. و أنّ المعنى أسبق من اللّفظ و يأتي قبله؛ لأنّه يعتمد على الفكر و التّأمّل. و يصنّف أقسام البيان تصنيفاً هرميّاً متسلسلاً من خلال طبقات تنحدر من سابقتها و تنتج عنها. كذلك يجعل ابن وهب يجعل أقسام البيان ناتجاً بعضها من بعضها الآخر. فهي عند النّاقدين عمليّة تولّد لتلك الوجوه . و على الرّغم من التّشابه الكبير في أقسام البيان عندهما لم يكن ابن وهب ناقلاً ناسخاً فقط بل إنّه أضاف و أضاء في بعض الأماكن؛ فقد انفرد في الحديث عن الكتّاب فحصرهم في خمسة هم كاتب خط و كاتب لفظ و كاتب عقد و كاتب حكم و كاتب تدبير. و ذكر أهمّ الصّفات التي يجب أن يتحلّى بها كاتب الخطّ. و قسّم المكاتبين إلى ثلاث مراتب و توسّع في الحديث عن أجناس الخطّ و أنواع القلم. و هذه الموضوعات أغفلها الجاحظ في أثناء حديثه عن أقسام البيان.