نماذج لم تبرمج مباشرة على يد البشر، بل دربت وغذيت بالمعلومات من مصادر لا حصر لها وابتلعت كميات هائلة من البيانات، لذا بنت خلال عملية التدريب هذه استراتيجياتها الخاصة لحل المشكلات.
على رغم القوة التي يحظى بها الذكاء الاصطناعي اليوم متسلحاً بأذكى أدواته العامة، النماذج اللغوية الكبيرة، إلا أن نقطة قوته وشهرته ووجوده بين يدي العامة أضحت تشكل اليوم هاجساً أشبه باللغز، إذ تحمل في أعماقها صندوقاً أسود يضم آليات عملها وطريقة تفكيرها التي لا يعرفها بشر قط. فهذه النماذج لم تبرمج مباشرة على يد البشر، بل دربت وغذيت بالمعلومات من مصادر لا حصر لها وابتلعت كميات هائلة من البيانات، لذا بنت خلال عملية التدريب هذه استراتيجياتها الخاصة لحل المشكلات، مشفرة في مليارات العمليات الحسابية التي يجريها النموذج لكل كلمة يكتبها، لتصل لمطوريها ملغزة. فالحقيقة أن حتى مطوريها لا يفهمون كيف تقوم النماذج بمعظم مهامها، وكل ما يمكننا معرفته اليوم شيئان فحسب، الأوامر التي نزودها بها والمخرجات التي تولدها، لكن كيفية وصولها إلى أي إجابة لا تظل لغزاً.
ولكن هذا الغموض تتبعه جملة من المشكلات والمخاوف، تتجسد في هلوستها وكسرها الحماية المفروضة عليها ونشرها معلومات خاطئة أو حتى مختلقة بثقة عالية، تشكل تحديات تؤرق الباحثين.
لكن يبدو أن "أنثروبيك"، شركة الذكاء الاصطناعي الأميركية المتخصصة بالنماذج اللغوية الكبيرة والذكاء الاصطناعي العام، قررت ألا تقف مكتوفة الأيدي بعد اليوم، بعدما طور باحثوها أداة جديدة أطلقت عليها "مجهر الذكاء الاصطناعي" للمساعدة في فهم كيفية عمل النماذج اللغوية الكبيرة والآلية التي تفكر بها.
الأداة الجديدة قادرة على فك تشفير طريقة تفكير النماذج استلهاماً من مجال علم الأعصاب، فما بناه باحثو "أنثروبيك" يشبه في جوهره فحوصات الرنين المغناطيسي الوظيفي التي يستخدمها علماء الأعصاب لمسح الأدمغة البشرية، وتحديد مناطق الدماغ التي تلعب الدور الأكبر في جوانب الإدراك المختلفة. وطبقت "أنثروبيك" هذه الأداة، الشبيهة بالرنين المغناطيسي، على "كلود 3.5 هايكو" الخاص بها، لتقدم بذلك مجموعة تفسيرات قدمت أجوبة أولية عن التساؤلات الرئيسة حول كيفية عمل "كلود" ورفاقه.
وفي هذ الصدد شاركت الشركة، التي أنشأها أعضاء سابقون لشركة "أوبن أي آي"، ورقتين بحثيتين تمثلان تقدماً في تطوير مجهرها وتطبيقه لاكتشاف بيولوجيا الذكاء الاصطناعي الجديدة. فبينما تكشف الورقة الأولى أجزاء من المسار الذي يحول الكلمات التي تدخل في "كلود" إلى الكلمات التي تخرج منه، تسلط الورقة الثانية الضوء على العالم الداخلي لنموذجها "كلود 3.5 هايكو" وتجري دراسات معمقة لمهام بسيطة.
وطرحت "أنثروبيك" أسئلة عدة حول نموذجها "كلود"، فمثلاً يستطيع "كلود" التحدث بعشرات اللغات، ما هي اللغة التي يستخدمها في عقله، إن وجدت؟ ويكتب النص كلمة كلمة، فهل يركز فقط على توقع الكلمة التالية أم إنه يخطط مسبقاً؟ ويستطيع "كلود" كتابة الطريقة التي فكر بها خطوة بخطوة، فهل يمثل هذا التفسير الخطوات الفعلية التي اتخذها للوصول إلى إجابة، أم إنه يختلق أحياناً حجة معقولة لنتيجة محسومة مسبقاً؟
وجد الباحثون أنه على رغم أن النماذج اللغوية الكبيرة، مثل "كلود"، دربت في البداية على التنبؤ بالكلمة التالية في الجملة، إلا أن كلود يبدو وكأنه يخطط مسبقاً قبل النطق بما سيقوله، ويكتب كلمات عدة للوصول إلى تلك الغاية، في الأقل عندما يتعلق الأمر بأنواع معينة من المهام. ويبدو ذلك في مجال الشعر، على سبيل المثال، عندما يطلب منه كتابة قصيدة، فهو يبحث عن الكلمات المتناغمة والمتوافقة في المعنى مع موضوع القصيدة ويفكر مسبقاً في كلمات مقفاة محتملة، ثم يعمل بصورة عكسية لبناء جمل تنتهي بتلك الكلمات، وهذا دليل قوي على أنه على رغم أن النماذج مدربة على إخراج كلمة واحدة في كل مرة، فإنها قد تفكر على نطاق أوسع بكثير للقيام بذلك.
أما في حالة الهلوسة (اختلاق معلومات)، وصلت "أنثروبيك" إلى نتيجة خلاف التوقعات، وهي أن السلوك الافتراضي لـ"كلود" هو رفض التكهن عندما يطرح عليه سؤال، وأنه لا يجيب عن الأسئلة إلا عندما يكبح شيء ما هذه المقاومة الافتراضية.
يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)
وفي حين أن هذه النماذج عرضة لعمليات كسر حماية مختلفة (يمكن خداعها لتخطي الحواجز والحدود التي يحاول مطورو نماذج الذكاء الاصطناعي وضعها حتى لا يستخدم بصورة مؤذية)، إلا أننا لا نفهم لماذا تعمل بعض عمليات كسر الحماية بصورة أفضل من غيرها، أو لماذا لا ينتج الضبط الدقيق، المستخدم لإنشاء الحماية، عوائق قوية بما يكفي لمنع النماذج من القيام بأشياء لا يريدها مطوروها.
كما أن "كلود" يقدم في بعض الأحيان حججاً تبدو معقولة وجديرة بالتصديق، صممت لتتفق وتتماشى مع المستخدم بدلاً من تصميمها باتباع الخطوات المنطقية، يظهر ذلك بطلب المساعدة منه في مسألة رياضية صعبة مع إعطائه تلميحاً خاطئاً، وهنا تقول "أنثروبيك" إنها اكتشفت أن "كلود" قادر فعلاً على اختلاق عملية استدلال خيالية.
وفي حين يتحدث "كلود" عشرات اللغات بطلاقة، كان من المثير معرفة كيف تعمل هذه القدرة، وتسأل "أنثروبيك" بداية عن إمكانية وجود "كلود فرنسي" و"كلود صيني" مثلاً منفصلين ويعملان بالتوازي، ويستجيبان للطلبات بلغتهما الخاصة، أم أن هناك أساساً لغوياً مشتركاً؟
أظهرت الأبحاث الحديثة على النماذج الأصغر إشارات لآليات قواعدية مشتركة بين اللغات، يقول باحثو الشركة، لقد قمنا بالتحقيق في هذا الأمر من خلال سؤال "كلود" عن الكلمة عكس كلمة صغير في لغات مختلفة، ووجدنا أن السمات الأساس نفسها لمفاهيم الصغر والتضاد تعمل على تنشيط وإثارة مفهوم الكبر، ثم يُترجم إلى لغة السؤال.
ووجد الباحثون أن "الدارت" المشتركة تزداد مع اتساع نطاق النموذج، إذ يتشارك "كلود 3.5 هايكو" أكثر من ضعف نسبة سماته بين اللغات مقارنة بنموذج أصغر، وهذا يقدم دليلاً إضافياً على نوع من العالمية المفاهيمية، أي وجود مساحة مجردة مشتركة حيث توجد المعاني ويمكن التفكير فيها قبل ترجمتها إلى لغات محددة.
ومن الناحية العملية، يشير هذا إلى أن "كلود" يستطيع تعلم شيء ما بلغة ما وتطبيق تلك المعرفة عند التحدث بلغة أخرى.
والحقيقة أن "أنثروبيك" أقرت بأن طريقتها هذه في فتح الصندوق الأسود للذكاء الاصطناعي تلفها بعض العيوب، وأوضحت أن ما قامت به مجرد محاولة تقريب لما يحدث بالفعل داخل نموذج معقد مثل "كلود"، إذ إنه حتى في حالة الأوامر البسيطة، فإن هذه الطريقة لا تلتقط سوى جزء بسيط من إجمال العمليات الحسابية التي أجراها "كلود". وأشارت إلى احتمال وجود خلايا عصبية خارج الدارات المحددة بالطريقة التي اتبعتها، على رغم أنها قد تلعب دوراً في تحديد مخرجات النموذج.
من جهة أخرى، صرح أحد مطوري تقنيات استكشاف أدمغة النماذج، وهو مجال يعرف باسم "قابلية التفسير الآلي"، بأنه بفضل هذه التقنيات يُحرز تقدم سريع، معتقداً أنه في غضون عام أو عامين آخرين، سنعرف عن كيفية تفكير هذه النماذج أكثر مما نعرفه عن كيفية تفكير البشر.
لكن الأكيد أن بحث "أنثروبيك" الجديد هذا يقدم في الأقل سبيلاً لحل بعض المشكلات والمخاوف المذكورة آنفاً المتعلقة بالأمن والسلامة، فقد يساعد الباحثين على تطوير أساليب تدريب جديدة لتحسين حواجز الحماية التي تمتلكها أنظمة الذكاء الاصطناعي ولتقليل الهلوسة والمخرجات الخاطئة الأخرى، مما من الممكن أن يسهم بصورة أكبر في تطوير نماذج ذكاء اصطناعي أكثر أماناً وموثوقية.