روبوت يتقن قراءة ومحاكاة حركة الشفتين بعد ساعات من التعلم عبر "يوتيوب"

المصدر : INDEPENDENT | الثلاثاء , 20 كانون الثاني | : 60

نجح روبوت مطور في جامعة كولومبيا في تعلم مزامنة حركة الشفتين عبر تحليل مقاطع "يوتيوب" والتدرّب أمام المرآة، مكتسباً قدرة شبه بشرية على النطق والغناء، في خطوة تمهد لروبوتات أكثر واقعية قادرة على التواصل البشري السلس وتتوقع استخدامها مستقبلاً في التعليم والطب والرعاية.

في إنجاز تكنولوجي غير مسبوق، أتقن أحد الروبوتات واحداً من الأنماط الحركية والتعبيرية الأكثر تعقيداً التي تميز الأداء البشري، ويتمثل في حركات الشفتين.

وبما أن نحو نصف انتباهنا أثناء التفاعلات وجهاً لوجه ينصب على إيماءات الشفتين، فليس مستغرباً أن نكون شديدي الحساسية لالتقاط أدق التغيرات في تعبيرات الوجه.

حتى وقت قريب، كانت الروبوتات تجد صعوبة في محاكاة حركة شفاه البشر، إذ غالباً ما تفتقر حركاتها إلى التناغم التام. وكان هذا الخلل كفيلاً بإحداث ما يُعرف بـ"وادي الغرابة" Uncanny Valley، وهو مصطلح في علم التفاعل بين الإنسان والآلة يصف شعوراً مريباً [فجوة في الاستجابة العاطفية] عند مواجهة آلة تبدو شبه بشرية إنما وجودها لا يبعث على الارتياح.

لكن هذا الواقع ربما يتغير قريباً، مع اقترابنا من مستقبل تصبح فيه الروبوتات مطابقة تماماً للبشر Indistinguishable، فتصل إلى درجة من الإتقان تجعل من المستحيل التمييز بين الآلة والإنسان.

في هذا السياق، أعلن مهندسون من "جامعة كولومبيا"، الأربعاء الماضي، أنهم نجحوا للمرة الأولى في ابتكار روبوت يمتلك القدرة على تعلم وإعادة إنتاج حركات الشفتين اللازمة للنطق والغناء.

يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)

وتعلم الروبوت كيفية التحكم في 26 محركاً في وجهه [مشغلات ميكانيكية دقيقة تعمل كبديل للعضلات] من طريق تحليل ساعات طويلة من مقاطع "يوتيوب"، ثم التدرب على محاكاة حركات الشفاه البشرية عبر مراقبة انعكاس صورته في المرآة.

استعرض الباحثون، في مجلة "ساينس روبوتكس" Science Robotics المتخصصة في علوم الروبوتات، قدرة الروبوت على نطق الكلمات بلغات عدة بصورة صحيحة، بل وأداء أغنية من ألبومه الأول، المنتج بالكامل بواسطة الذكاء الاصطناعي، ويحمل العنوان "هيلو وورلد" Hello World (مرحباً أيها العالم).

وفي تعقيبهم على الإنجاز، قال المهندسون هود ليبسون، وجيمس، وسالي سكابا من "مختبر الآلات الإبداعية" في "جامعة كولومبيا"، حيث أنجز المتخصصون المشروع "كلما زاد تفاعل الروبوت مع البشر، ارتقى مستوى أدائه".

لكن الباحثين يقرون بأن حركات الشفتين ما زالت بعيدة عن مرحلة الكمال، إذ أوضح ليبسون قائلاً: "واجهنا تحديات تقنية خاصة في محاكاة الأصوات التي تحتاج إلى جهد واضح للنطق مثل الحرف "بي" B [تسمى الحروف الانفجارية أو المضغوطة Plosives التي تنتج عن انحباس الهواء ثم انطلاقه فجأة]، وكذلك الأصوات التي تتطلب زمّ الشفتين lip puckering كما في حرف "دبليو" W’. إلا أن هذه المهارات ستشهد تطوراً ملحوظاً مع استمرار عملية التدريب والممارسة".

وقال ليبسون "اليوم يتركز الجزء الأكبر من بحوث الروبوتات المصممة لتحاكي الهيئة البشرية في الشكل والوظيفة على حركة الأرجل واليدين، لأداء مهام مثل المشي والإمساك بالأغراض"، مضيفاً "ولكن التعبير الوجهي لا يقل أهمية في أي تطبيق روبوتي يهدف إلى التفاعل المباشر مع البشر".

ومن جانبه، أوضح يوهانغ هو، الذي قاد الدراسة ضمن أطروحته للدكتوراه "عندما تُدمج قدرة مزامنة حركة الشفتين مع نظام ذكاء اصطناعي حواري قادر على صياغة ردود نصية وصوتية تحاكي منطق البشر، على غرار "تشات جي بي تي" أو "جيميني"، يمنح ذلك التواصل بين الإنسان والآلة عمقاً جديداً كلياً".

وفق ليبسون وهو، من المتوقع أن تجد الوجوه الدافئة والشبيهة بالحياة على الروبوتات تطبيقات واسعة في مجالات الترفيه والتعليم والطب، وحتى في رعاية المسنين. ويتنبأ متخصصون اقتصاديون بإنتاج أكثر من مليار روبوت شبيه بالبشر خلال العقد المقبل.

ويقول ليبسون "لا يمكن تصور مستقبل تخلو فيه الروبوتات الشبيهة بالبشر من الوجوه، وحين تكتسب هذه الروبوتات وجوهاً في نهاية المطاف، سيكون لزاماً عليها تحريك عيونها وشفاهها بدقة وإحكام، وإلا ستظل عالقة إلى الأبد في ’وادي الغرابة‘".

يأتي هذا العمل ثمرة مسعى علمي امتد لعشرة أعوام بقيادة ليبسون، ويهدف إلى جعل الروبوتات أكثر كفاءة في التواصل مع البشر. ويشدد ليبسون على ضرورة اكتساب هذه المهارات عبر التعلم، بدلاً من الاعتماد على البرمجة التقليدية القائمة على القواعد الجامدة.

ويختم ليبسون قائلاً "شيء أشبه بالسحر يتجلى حين يتعلم الروبوت الابتسام أو النطق بمجرد مراقبة البشر والاستماع إليهم. وعلى رغم أنني عالم روبوتات أمضى أعواماً في مجاله حتى صار من الصعب إبهاره، فإنني لا أملك إلا أن أرد الابتسامة لروبوت يبتسم لي بعفوية".

© The Independent