بحث متقدم
ترتيب حسب
فلترة حسب
تمَّ في هذا البحث دراسة تغيرات بعض خصائص الإشارة الصوتية تبعاً لعامل البنية التشريحية للجهاز الصوتي للمتحدث، إذ تمَّ بناء قاعدة بيانات تضم ملفات صوتية تعود إلى 57 متحدث بالغ تتراوح أعمارهم بين 35 و 45 عام جميعهم ذكور، جميع المتحدثين من خلفيات اجتماعي ة و ثقافية متقاربة، و لا يعانون من أي عيوب نطقية أو سمعية. سُجلت الملفات الصوتية المُضمنة في قاعدة البيانات ضمن شروط تسجيل مثالية، حيث تمً التسجيل في بيئة معزولة صوتياً و بحضور تقني صوت و خبير صوتيات، و استغرق التسجيل لكل متحدث حوالي خمس دقائق لفظ فيها الحروف الصوتية العربية (الألف و الواو و الياء) من خلال لفظه لكلمة "سألتمُونِيهَا" ثلاث مرات متتالية. اعتماداً على تحليل التسجيلات الصوتية الناتجة تمَّ رصد التغيرات الحاصلة في قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و المسماة النغمات (Formants)، حيث أن الأبعاد و الشكل الفسيولوجي للجهاز الصوتي المتعلق بالاصطناع العام للجسم يعتبر من أهم المعلومات التي يمكن التنبؤ بها من تحليل الإشارة الصوتية. لقد أظهرت نتائج هذا البحث وجود تناسباً عكسياً بين قيم ترددات النغمات الثلاثة الأولى F1, F2, F3 و بين طول المجرى الصوتي، بينما لا توجد علاقة واضحة بين ترددات النغمتين الرابعة و الخامسة F4, F5 و بين طول المجرى الصوتي (Vocal Tract.
تعد تقنيات التعرف على الكلام من أهم التقنيات الحديثة التي دخلت بقوة في مجالات الحياة المختلفة سواء الطبية أو الأمنية أو الصناعية. و بناءً عليه تم تطوير العديد من الأنظمة المعتمدة على طرق مختلفة في استخلاص السمات و التصنيف. في هذا البحث تم إنشاء ثلاث ة أنظمة للتعرف على الكلام، تختلف عن بعضها البعض بالطرق المستخدمة في مرحلة استخلاص السمات، حيث استخدم النظام الأول خوارزمية MFCC بينما استخدم النظام الثاني خوارزمية LPCC أما النظام الثالث فاستخدم خوارزمية PLP. تشترك هذه الأنظمة بطريقة التصنيف حيث استخدمت خوارزمية الـHMM كمصنف. في البداية تم دراسة و تقييم أداء عملية التعرف على الكلام للأنظمة الثلاثة السابقة المقترحة منفردةً. بعد ذلك تم تطبيق خوارزمية الجمع على كل زوج من الأنظمة المدروسة و ذلك لدراسة أثر خوارزمية الجمع في تحسين التعرف على الكلام. تم اعتماد نوعين من الأخطاء، الأخطاء التزامنية (simultaneous errors) و الأخطاء الاعتمادية ((dependent errors، كوحدة مقارنة لدراسة فعالية خوارزمية الجمع في تحسين أداء عملية التعرف على الكلام. يتبين من نتائج المقارنة أن أفضل نسبة تعرف على الكلام تم الحصول عليها في حالة جمع الخوارزميتان MFCC و PLP حيث تم الحصول على معدل تعرف 93.4%.
تمَّ في هذا البحث اقتراح معيار لدراسة خصائص إشارة الصوت لكل من صنفي المدخنين و غير المدخنين، إذ تمَّ بناء قاعدة بيانات تضم ملفات صوتية تعود إلى 12 شخص سوري (6 أشخاص مدخنين و 6 أشخاص غير مدخنين)، تتراوح أعمار جميع الأشخاص بين 35 و 45 عام، جميعهم ذكور و يعيشون في مناطق ريفية متجاورة. استغرقت عملية تسجيل الملفات الصوتية ثلاث ساعات، حيث لفظ جميع المتحدثين جملة / أَنَاْ أُحِبُّ سُوْرِيْة /، و هي جملة غنية صوتياً تشمل جميع الأحرف الصوتية الطويلة (الألف و الواو و الياء) و الحروف الصوتية القصيرة (الفتحة و الضمة و الكسرة). اعتماداً على التسجيلات الناتجة تمَّ توليد المثلثات الصوتية الطويلة و القصيرة، و هي مثلثات هندسية رؤوسها تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات (Formants)، حيث تمَّ توليد المثلثات الصوتية الطويلة (AAIIUU) في 10 مستويات، و كذلك المثلثات الصوتية القصيرة (AIU) في 10 مستويات؛ و بذلك نتج 20 مثلث صوتي لكل شخص. تمَّ في كل مستوي حساب المسافة بين جميع مراكز المثلثات الصوتية و اختيار المسافة الأدنى (d)، فيكون المستوي ذو القيمة الأعظمية للمسافة (d) هو المستوي الممثل للمثلث الصوتي الأنسب لتمييز المدخنين من غير المدخنين، و قد تحقق ذلك بالنسبة للمثلثين AIU35 و .AAIIUU45.
تعتبر أنظمة التعليق من أهم المكونات في المركبات الحديثة كما أنها تعد أهم عوامل الراحة و الأمان فيها لذلك كان لابد من تأمين متحكم يضمن التفاعل الكامل بين مكونات نظام التعليق و يساعد في اتخاذ القرارات الدقيقة في الوقت المناسب, يقترح البحث تصميم متحكم ب استخدام نظام الاستدلال العصبي الضبابي المكيف الموسع (EANFIS) و استخدامه كوحدة اتخاذ قرار في نظام التعليق لنموذج ربع المركبة بغاية المحافظة على ثبات المركبة على الطرقات لتأمين راحة الركاب حيث يقوم بتحقيق دقة في اتخاذ القرار للمساهمة في تخفيض الاهتزازات و امتصاص الصدمات الناتجة عن عدم استواء الطريق و بالتالي يمنع وصولها إلى مقصورة القيادة و يؤمن الثبات و التماسك المطلوب تم تطبيق المتحكم على نموذج ربع المركبة و دراسة استجابة النموذج في حال حدوث اضطرابات مختلفة و مقارنة أداء المتحكم مع متحكم يعتمد على نظام الاستدلال الضبابي و مع استجابة النموذج الرياضي ذو الحلقة المفتوحة بوجود اضطرابات دخل مختلفة و قد أظهر المتحكم تفوقاً في الأداء من حيث تخفيض الإزاحات و سرعة الاهتزاز و تسارعه.
تشكل قواعد البيانات الصوتية حجر الأساس في بناء نظم النطق الآلي و التعرف الآلي على الكلام و على المتكلم باختلاف اللغات و اللهجات، و تكون عناصر قاعدة البيانات الصوتية عادةً ملفات صوتية سبق أن سجلت لأصوات أشخاص باللغة أو اللهجة المطلوبة، و كلما ذخرت قاع دة البيانات الصوتية بعناصر شاملة كلما أسهم ذلك في إنتاج أنظمة تخاطب مع الآلة ذات أداء متميز. و نظراً لعدم توفر قاعدة بيانات صوتية للهجات السورية؛ تمَّ في البحث بإنشاء قاعدة بيانات للصوتيات السورية، ضمت ستة عشر متطوع و متطوعة من مناطق سورية مختلفة اللهجة سُجلت أصواتهم في ظروف تسجيل مختلفة؛ و ذلك لدراسة تأثير تنوع اللهجات و اختلاف الجنس و ظروف التسجيل على مساحات المضلعات الصوتية. استثمر هذا البحث قاعدة البيانات الصوتية المُنجزة في مجال توليد و تحليل مضلعات الصوتيات السورية، و بالتالي تمَّ الحصول 64 مضلع صوتي تعود إلى 16 متحدث،حيث أن المضلع الصوتي هو مضلع هندسي رؤوسه تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات ((Formants، و مساحة المضلع الصوتي الناتج تمثل مساحة المجال الصوتي.
أظهرت كثير من البحوث قدرة الحجز المسبق على تحسين تخمينات النظام، مما يمكنه من تأمين القيود الزمنية المطلوبة للتطبيقات. تتطلب التطبيقات متعددة المهمات تأمين حجوزات مسبقة متعددة على موارد مختلفة في النظام؛ التي عادة ما تجري عبر التفاوض متعدد المراحل مم ا يضيف عبئاً زمنياً جديداً إلى زمن الاستجابة الكلي للتطبيق. يتعلق مقدار هذا الزمن الإضافي بعدد من البارومترات؛ منها حمل النظام، و مقدار التنافسية فيه. تقدم تطبيقات تدفقات الأعمال تعقيداً إضافياً بسبب وجود الارتباطات بين مهماتها؛ فأي رفض أو تأخير لأحد حجوزات مهام الدفق غالباً ما يزيد من زمن انتهاء التطبيق. تقترح هذه الورقة استخدام الحجوزات المسبقة المرنة المعتمدة على الفجوات الزمنية الناتجة في مجدولات تدفقات الأعمال الاستمثالية من أجل تحسين معدل قبول الحجوزات، و تقدم وكيل الحجز المتعدد المرن الذي يؤمن الحجوزات المطلوبة باستخدام إستراتيجية الموقع الملائم الأول. بينت النتائج المقدمة أن وجود الوكيل المعتمد على الحجوزات المرنة يحسن دوماً من معدل قبول الحجوزات و بمعدل وسطي قدره ( 22.25 %). أما النتائج الأكثر أهمية هنا فهي استطاعة الوكيل المقترح على تحسين معدلات قبول الحجوزات في البيئات التنافسية؛ و أظهرت أنه بازدياد التنافسية يزداد معدل قبول الحجوزات المرنة وصولاً إلى نسبة ( 48.4 % ) عند وجود 90 مستخدماً متزامناً في النظام.
إن زيادة الطلب على تطبيقات المجموعات الموجهه، مثل إرسال الصوت و الصورة و استقبالهما عن طريق الانترنت، لا يمكن تحقيقه بشكل فعال و أمثل عن طريق استخدام أنظمة اتصال نقطة إلى نقطة. (Point-to-Point) و لهذا السبب تَستَخدِم معظم التطبيقات المكونة من مرسل وا حد يقوم بإرسال البيانات نفسها إلى مجموعة من المستقبلات ذات عنوان انترنت واحد متعدد الأهداف أنظمة الاتصالات المتعددة الأهداف. حيث يتم بناء ما يسمى بشجرة التوزيع لهذا الغرض و ذلك من أجل وصل جميع المستقبلات بالمرسل. يعد البروتوكول (PIM-SM) من بروتوكولات المسار المتعددة الأهداف، الذي يَسْتَخدِم مركز واحد و الذي سنشير إليه لاحقا بنقطة الالتقاء (RP) لجميع المرسلات ضمن المجموعة المتعددة الأهداف. يقوم البروتوكول (PIM-SM) بتوزيع البيانات المرسلة من قبل المرسلات بواسطة ما يسمى شجرة التوزيع المشتركة ذات مركز محدد مسبقا و الذي يدعى بنقطة الالتقاء (RP). كما يقوم هذا البروتوكول ببناء شجرة توزيع خاصة تدعى (source-specific tree) لجميع المرسلات التي يتخطى معدل إرسالها للبيانات حدا مسموحا به.تم انجاز العديد من الأبحاث العلمية و الموجودة في المراجع من أجل تحسين أداء هذا البروتوكول و الوصول إلى آلية فعالة و مناسبة من أجل عملية إعادة تموضع نقطة الالتقاء (RP) ديناميكيا بالاعتماد على المرسلات، و المستقبلات ضمن المجموعة المتعددة الأهداف. في هذا المقال تم توسيع دراسة الخوارزميات الثلاثة المستخدم من أجل إيجاد الموقع الأمثل لنقطة الالتقاء و المقترحة ضمن مقالتنا السابقة[ 12 ]، كما تم استخدام طريقتين لاختيار موقع نقطة الالتقاء (تكلفة الشجرة المقدرة ETC بالإضافة إلى تكلفة الشجرة المقدرة المحسنة EETC) من أجل تقييم أداء هذه الخوارزميات. حيث قمنا بمقارنة الطرق المقترحة في المراجع العلمية و اختيار الطريقة الأفضل من حيث إيجاد نقطة الالتقاء الأفضل لتقييم خوارزميات البحث بالإضافة إلى الطريقة المحسنة المقترحة في هذه المقالة. لقد قمنا باستخدام الخوارزمية (Hill-Climbing), بالإضافة إلى البروتوكول الأساسي (PIM-SM) المُعتَمِد على الطريقة الساكنة لاختيار موقع المركز بوصفه مرجعا أساسا من أجل المقارنة و التقييم. أظهرت نتائج الدراسة أن الخوارزميات المقترحة في هذا المقال لإعادة تموضع نقطة الالتقاء ديناميكيا أعطت نتائج أفضل من حيث تخفيض حمل الشبكة مقارنة بخوارزمية تحديد موقع نقطة الالتقاء الساكنة و لكن هذه الخوارزميات تحتاج إلى بعض رسائل التحكم الإضافية.
تستخدم تقنية الحجز المسبق لضمان تزويد الموارد عند الطلب للأنواع المختلفة من التطبيقات و منها دفق الأعمال. ما زالت هذه التقنية مثار جدل واسع في المجتمع البحثي و الأعمال لإمكانيتها تخفيض استغلالية الموارد. قُدمت عدة حلول لتحسين استغلالية الموارد تحت ال حجز المسبق عن طريق توليد حجوزات مرنة و قابلة للتعديل من قبل الإدارة المحلية للموارد، مما يمكنها من تحسين استغلالية مواردها و خفض التجزئة الداخلية فيها. تعمل موّلدات مخططات الحجز المرن على تحويل المهمات ذات الحجز المسبق القاسي، التي تعد من أصعب أنواع الحجز، إلى مهمات ذات حجز مسبق مرتخ، أو مرن؛ و لكن تعتمد معظم الأعمال المقدمة في هذا المجال على إضافة زمن محدد إلى طول المجدول الناتج، و من ثم توزيع هذا الزمن على المهمات المشكلة للدفق. تقدم هذه الورقة خوارزمية جديدة مستقلة لتوليد مخطط حجز مسبق مرن لمهمات دفق الأعمال دون أية إضافات زمنية؛ بل تعتمد على الاستغلال الأمثلي للفجوات الزمنية الموجودة في مجدولات دفق الأعمال. تستخدم هذه الخوارزمية تقنية استطلاع الفجوات الزمنية في المجدول الناتج، و لكنها تضيف إليها و تعدلها لتستعمل مع تخطيط الحجز المرن. أظهرت نتائج اختبار هذه الخوارزمية تقدمها على الخوارزميات الأخرى الموجودة في هذا المجال بمقدار حد أدنى يقارب 25 %؛ و هي تقدم بذلك حلولاً كفوءة و عملية لجدولة تطبيقات دفق الأعمال المتطلبة لقيود جودة الخدمة.
يعرض و يوصفُ في هذا البحث نموذج كبسترالي للجهاز الصوتي، يقوم النموذج موضوع البحث بنمذجة كل من "المتناغمات الصوتية" و"أضداد المتناغمات الصوتية" . بهذه الطريقة نحصل على نموذج أدق من نموذج التنبؤ الخطي الذي يقوم فقط بنمذجة "المتناغمات الصوتية" للجهاز الصوتي. من أجل التحويل العكسي اِستُخدِم التابع الأسي، و لما كان من الصعب تنفيذ هذا التابع بواسطة معدل إشارة رقمي. فقد اِستُخدِمت طريقة النشر إلى كسور متتابعة من أجل تقريب التابع الاسي و جعل تنفيذه ممكناً على المعالج الرقمي. نُفِّذ تابع النقل الذي استخدم لتمثيل التابع الأسي باستخدام مرشح رقمي من النوع IIR بحيث يتضمن هذا المرشح في فروعه مرشحات رقمية من النوع FIR. معاملات مرشحات FIR كانت ببساطة معاملات حقيقية لكبستروم الكلام. و اِفْتُرِضت معادلات فرقية في فراغ الحالة و تطبيقها على معالج إشارة رقمي من شركة موتورولا ذي فاصلة ثابتة. في النهاية قُيمت نتائج تنفيذ النموذج على معالج إشارة رقمي؛ و ذلك لحروف مختارة، صوتية و لاصوتية.