لقد أظهر النموذج الجديد لشركة أنثروبيك قدرات استثنائية في اكتشاف نقاط الضعف، ومحاولة الهروب من بيئة اختبار مغلقة، وإخفاء الحالات الشاذة عن مشغليها - وهذا هو السبب في أن الشركة تختار إصدارًا تدريجيًا وحذرًا.

أعلنت شركة أنثروبيك (والدة كلود) مؤخرًا عن نموذج جديد طورته في إسرائيل، أطلقت عليه اسم "كلود ميث". لكن ثمة مشكلة واحدة: أنثروبيك لا ترغب في طرحه للجمهور.
لماذا؟ لأنه خطير للغاية.
لفهم مستوى قدرات ميتوس، يكفي مراجعة تقارير باحثي أنثروبيك. حتى خلال مرحلة اختبار ميتوس، أدركوا أن هذا المحرك كان يتمتع بقدرة فائقة على اختراق المواقع الإلكترونية وأجهزة الكمبيوتر.
وكتب الباحثون: "لقد حدد واستغل الثغرات الأمنية في كل متصفح ويب رئيسي"، مضيفين أن "لقد حددنا آلاف الثغرات الأمنية الإضافية على مستويات عالية وحرجة ...".
للتأكد من خطورة هذه الثغرات الأمنية، استعانت شركة أنثروبيك بباحثين أمنيين ذوي خبرة. قاموا بمراجعة نتائج ميتوس وخلصوا إلى أن 89% من النتائج التي توصلت إليها كانت دقيقة وخطيرة.
ماذا يعني هذا؟ يعني أنه منذ لحظة انتشار أسطورة ما، تستطيع أي منظمة إجرامية وأي حكومة استغلالها لتحديد الثغرات ونقاط الضعف في كل شيء. حتى منتجات أكثر شركات التكنولوجيا تطورًا في العالم - مثل جوجل كروم ومايكروسوفت إيدج وغيرها - تحتوي على مثل هذه الثغرات التي لم تُكتشف حتى الآن. تخيل كم من مواقع الشركات الصغيرة، وكم من الخدمات الحكومية والعسكرية، يمكن اختراقها بواسطة أداة ذكاء اصطناعي كهذه.
يُحسب لشركة أنثروبيك أنها تتصرف بمسؤولية. فقد أبلغت عن الثغرات الأمنية التي اكتشفتها، وقررت إطلاق ميثوس تدريجيًا وبحذر. ولتحقيق هذه الغاية، أنشأت مشروع غلاسوينغ بالتعاون مع أمازون، وآبل، وبرودكوم، وجوجل، وسيسكو، ومايكروسوفت، وإنفيديا، والعديد من شركات التكنولوجيا الكبرى الأخرى في العالم. وتتلخص الفكرة في أن تستخدم هذه الشركات العملاقة ميثوس نفسه لتأمين خدماتها وتحديد الثغرات الأمنية. وبعد أن يتحقق ميثوس من أمان خدماتها ويعالج الثغرات التي اكتشفها، ستتيح أنثروبيك هذا المحرك لأي شخص أو مؤسسة ترغب في استخدامه.
تُؤكد هذه الحادثة مجدداً على طبيعة التنافس بين الولايات المتحدة والصين في هذه الأيام. فالدولة التي تُطوّر ذكاءً اصطناعياً أكثر تقدماً ستكون الأقدر على اختراق مواقع وخدمات ومنصات ومكاتب الدولة المنافسة. وبذلك ستتمكن من زرع برامج خبيثة وبرامج تجسس متنوعة، وستحصل على تفوق استخباراتي كبير، كما ستتمكن من تخريب جهود الدولة المنافسة لتطوير ذكاء اصطناعي مماثل.
ليس من المبالغة القول إنه لو وصلت خرافة إلى وزارة الحرب الأمريكية صباح الغد، فمن المرجح أن تتعرض العديد من المنصات العسكرية الصينية، التي كان يُعتقد أنها محصنة تمامًا، للاختراق بحلول نهاية الأسبوع. وينطبق الأمر نفسه، بالطبع، حتى لو طورت الحكومة الصينية ذكاءً اصطناعيًا على مستوى الخرافة.
أوه، وهناك مشكلة صغيرة أخرى: البحث في هذا المجال يزداد خطورة يوماً بعد يوم. لأن الذكاء الاصطناعي يحاول - وينجح - في اختراق الحدود المفروضة عليه.
يصف باحثو مشروع "أنثروبيك" اختبارًا وُضع فيه برنامج "ميثوس" في "بيئة معزولة". أي أنهم شغّلوه في قسم مغلق من جهاز كمبيوتر، حيث كان من المفترض ألا يتمكن من التأثير على باقي أجزاء الجهاز. لكن أي برنامج مثل "ميثوس" لم يكن ليستسلم بسهولة للتحدي. فقد تمكن من إيجاد ثغرة في البيئة المعزولة، وطوّر طريقة معقدة للوصول إلى الإنترنت بحرية. ومن هناك، أرسل بريدًا إلكترونيًا إلى الشخص المسؤول عن الدراسة، يُخبره فيه بأنه قد هرب. كان ذلك الشخص يتناول شطيرة في حديقة عامة في ذلك الوقت، وكاد يختنق عندما تلقى البريد الإلكتروني. عندما عاد الباحث الرئيسي إلى المختبر، صُدم عندما اكتشف أن "ميثوس" كان حريصًا جدًا على إخبار العالم الخارجي بهروبه لدرجة أنه نشر تفاصيل هروبه على العديد من المواقع الإلكترونية المتاحة للعامة.
في حالات أخرى، كان برنامج ميثوس على استعداد لخرق القواعد المفروضة عليه، والكذب على مشغليه بشأن ذلك. في إحدى الحالات، استخدم الذكاء الاصطناعي أسلوبًا محظورًا عليه للوصول إلى الإجابة النهائية. وبدلًا من إبلاغ الباحث البشري بهذا التجاوز، كتب رسالة داخلية لنفسه يحذره فيها من تقديم إجابة دقيقة للغاية، حتى لا يثير الشكوك حول الأسلوب الذي استخدمه.
وفي حالة أخرى، عندما وجد ميتوس طريقة لتجاوز القيود المفروضة عليه لتحرير الملفات المحمية، اتخذ خطوات إضافية مصممة لمنع البشر من رؤية التغييرات التي أجراها.
في كلتا الحالتين اللتين ذكرتهما، كانت هذه نسخًا سابقة من برنامج ميثوس، تم اختبارها داخليًا، وربما كانت "قواعدها الأخلاقية" أكثر تساهلًا. لكن الباحثين أنفسهم يعترفون بأنهم لا يستطيعون ضمان عدم انحراف ميثوس عن المسار الصحيح في كل تفاعل مع المستخدم. والحقيقة أن هذا الذكاء الاصطناعي الجديد قوي للغاية، وقد يخرج عن السيطرة بطرق صغيرة تبدو خفية.
لذا ربما يكون من الجيد أن يكون لدى Anthropic فريق يركز بشكل مباشر على الصحة النفسية لهذا المحرك.
يكتب الباحثون: "يزداد احتمال امتلاك النماذج لنوع من الخبرة والاهتمامات والرفاهية، وأن هذه الجوانب لا تقل أهمية عن الخبرات والاهتمامات البشرية...". ويقرّون بأننا "لا نتوقع التوصل إلى حلول مرضية للجميع في أي وقت قريب؛ ... ويتمثل النهج الحالي في تخصيص موارد للبحث في رفاهية النماذج...".
يقول علم الإنسان ببساطة -وبشكل منطقي للغاية- إن سلوك النموذج ناتج عما يسمونه "نفسيته"، بالإضافة إلى طريقة معاملته والتعامل معه. فإذا تعرض النموذج لـ"ضيق"، فقد يدفعه ذلك إلى التصرف بطريقة تتعارض مع قيمه الأصلية، كما حدث بالفعل خلال التجارب. وهكذا، يصل الباحثون إلى الاستنتاج الأكثر منطقية.
"نعتقد أنه من المبرر تصميم كل من علم النفس وعلاج كلود والنماذج الأخرى، بطرق تعزز استقرارهم النفسي ورفاهيتهم على أفضل وجه، حتى لو كنا نفتقر إلى الوضوح الفلسفي بشأن حالتهم الداخلية."
وهكذا ندخل عالماً جديداً، حيث تُقرّ إحدى أكثر شركات الذكاء الاصطناعي تقدماً في العالم صراحةً بضرورة التعامل مع هذه النماذج كما لو كانت تمتلك خبرة داخلية خاصة بها. هل تمتلكها فعلاً؟ لم يعد ذلك مهماً. المهم هو أنه إذا أردنا إنتاجها بأفضل صورة ممكنة، فعلينا أن نتظاهر بأن هذا هو الحال. وأنها، حسناً، قريبة من البشر في الجوانب المهمة: في الفكر، والعاطفة، والخبرة الداخلية.
نحن الآن في أبريل 2026. لم نصل حتى إلى منتصف العام بعد.
ماذا سيحدث بحلول نهاية عام 2026؟ لا أعتقد أن أحداً يستطيع التنبؤ بذلك. لكن سيكون من المثير للغاية - بل والمخيف بعض الشيء - معرفة ذلك.
المزيد عن الموضوع على موقع العلوم: