الذكاء الاصطناعي يعيد لبريطانية صوتها المفقود منذ 25 عاما
يشجع الأشخاص الذين يتوقع أن يفقدوا قدرتهم على الكلام بسبب حالات مثل مرض العصبون الحركي حالياً على تسجيل أصواتهم في أسرع وقت ممكن، كوسيلة للحفاظ على "هويتهم" إلى جانب قدرتهم على التواصل.
استعادت بريطانية عاجزة عن النطق بسبب إصابتها بمرض العصبون الحركي، القدرة على التكلم بصوتها الطبيعي بفضل الذكاء الاصطناعي ومقطع فيديو منزلي قديم بالكاد يسمع مدته ثماني ثوان.
فقدت الفنانة سارة إيزيكيال صوتها بعد تشخيص إصابتها بمرض العصبون الحركي في سن الـ34 أثناء حملها بطفلها الثاني قبل 25 عاماً.
هذه الحالة التي تلحق ضرراً تدريجاً بأجزاء من الجهاز العصبي، يمكن أن تسبب ضعفاً في عضلات اللسان والفم والحلق، مما قد يؤدي إلى فقدان بعض المصابين القدرة على الكلام تماماً.
خلال الأعوام التي تلت تشخيصها، تمكنت إزكيال المتحدرة من شمال لندن من استخدام جهاز كمبيوتر وتقنية توليد الأصوات لمساعدتها على التواصل، وإن كان ذلك بصوت مختلف تماماً عن صوتها.
وتمكنت من مواصلة مسيرتها الفنية باستخدام مؤشر الكمبيوتر cursor لإنشاء صورها. لكن ولديها أفيفا وإريك لم يسمعا صوت والدتهما.
خلال الأعوام الأخيرة، ازدادت قدرة الخبراء على استخدام التكنولوجيا لإنشاء نسخ حاسوبية من صوت الشخص الأصلي.
لكن هذه التقنية تتطلب عموماً تسجيلات طويلة وعالية الجودة، وحتى في هذه الحالة، تميل إلى إنتاج أصوات تشبه صوت المريض، لكنها "مسطحة ورتيبة"، وفق ما أوضح سايمن بول من شركة الاتصالات الطبية البريطانية "سمارت بوكس".
وأضاف بول أن الشركة طلبت في الأصل من إيزيكيال تسجيلاً صوتياً لمدة ساعة.
يشجع الأشخاص الذين يتوقع أن يفقدوا قدرتهم على الكلام بسبب حالات مثل مرض العصبون الحركي حالياً على تسجيل أصواتهم في أسرع وقت ممكن كوسيلة للحفاظ على "هويتهم" إلى جانب قدرتهم على التواصل.
ولكن في عصر ما قبل الهواتف الذكية، كان الحصول على تسجيلات مناسبة للاستفادة منها أقل شيوعاً بكثير.
عندما لم تعثر إيزيكيال سوى على مقطع صوتي واحد قصير جداً ورديء الجودة، قال بول إنه "انتابه شعور بالحزن".
يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)
كان المقطع من فيديو منزلي التقط خلال تسعينيات القرن الـ20 مدته ثماني ثوان فحسب، مكتوماً مع ضوضاء خلفية من التلفزيون.
لجأ بول إلى تقنية طورتها شركة "إيليفن لابز" ElevenLabs المتخصصة في تقنيات الذكاء الاصطناعي في نيويورك، والتي لا تنتج صوتاً يعتمد على معلومات بسيطة فحسب، بل تجعله يبدو أقرب إلى صوت إنسان حقيقي.
واستخدم أداة ذكاء اصطناعي لعزل عينة صوتية من المقطع، وأداة أخرى - مدربة على أصوات حقيقية لملء الفراغات - لإنتاج الصوت النهائي.
كانت النتيجة، لحسن حظ إيزيكيال، قريبة جداً من صوتها الأصلي، مع لهجتها اللندنية واللثغة الطفيفة التي كانت تكرهها سابقاً.
قال بول "أرسلت لها عينات (صوتية)، فردت علي برسالة بريد إلكتروني تقول فيها إنها كادت تبكي عندما سمعتها".
وأضاف "قالت إنها شغلت المقطع لصديقة تعرفها قبل أن تفقد صوتها، وشعرت وكأنها استعادت صوتها".
وبحسب جمعية مرض العصبون الحركي في المملكة المتحدة، يعاني ثمانية من كل 10 مصابين بهذا المرض من صعوبات في النطق بعد التشخيص.
لكن وتيرة الكلام والحدة ونبرة الأصوات المولدة حاسوبياً حالياً "قد تكون آلية تماماً".
وأوضح بول أن "التقدم الحقيقي في تقنية الذكاء الاصطناعي الجديدة هذه أن الأصوات أصبحت بشرية ومعبرة حقاً، وهي تعيد ذلك الطابع البشري إلى الصوت الذي كان يبدو سابقاً حاسوبياً بعض الشيء". ولفت إلى أن تخصيص الصوت يشكل وسيلة للحفاظ على "هوية" الشخص.
وقال "القدرة على التحدث باستخدام صوتك الأصلي أمر بالغ الأهمية، بدلاً من استخدام صوت عادي، خصوصاً إذا أصبت بحالة مرضية خلال وقت لاحق من حياتك وفقدت صوتك".