تغطية شاملة

هل تمتلك أنظمة الذكاء الاصطناعي بالفعل لغتها السرية الخاصة؟

قدم الباحثون في الولايات المتحدة ادعاءً مثيرًا للاهتمام مفاده أن نموذج DALL-E 2 ربما اخترع لغته السرية الخاصة لفهم أوصاف الأشياء.

من: آرون ج. سنوويل، زميل أبحاث ما بعد الدكتوراه، القانون الحسابي ومسؤولية الذكاء الاصطناعي، جامعة كوينزلاند للتكنولوجيا

الذكاء الاصطناعي يرسم. الصورة: موقع Depositphotos.com
الذكاء الاصطناعي يرسم. الصورة: موقع Depositphotos.com

يمكن لجيل جديد من نماذج الذكاء الاصطناعي (AI) إنتاج صور "إبداعية" عند الطلب بناءً على المطالبات النصية. البرمجيات مثل صورة, ميدجورني ودال-E 2 بدء تغيير طريقة إنشاء المحتوى الإبداعي مع ما يترتب على ذلك من آثار على قضايا حقوق النشر والملكية الفكرية.

وفي حين أن مخرجات هذه النماذج غالبا ما تكون مثيرة للإعجاب، فمن الصعب أن نعرف بالضبط كيف تنتج نتائجها (وهي مشكلة ترافق عالم التعلم العميق بأكمله ولا يوجد لها إجابة حتى الآن، على الرغم من أن العديد من الشركات، بما في ذلك IBM، تدعي تطوير الأنظمة من شأنها أن توفر تفسيرات، ولكن لم يتم طرح مثل هذا النظام في السوق حتى الآن). في الأسبوع الماضي، قدم باحثون في الولايات المتحدة ادعاءً مثيرًا للاهتمام مفاده أن نموذج DALL-E 2 ربما اخترع لغته السرية الخاصة لفهم أوصاف الأشياء.

قام الباحثون بتغذية DALL-E 2 بطلب لإنشاء صور تحتوي على تعليقات نصية، ثم قاموا بتغذية التسميات التوضيحية الناتجة (رطانة) مرة أخرى في النظام، وخلص الباحثون إلى أن DALL-E 2 يعتقد أن فيكوتيس معناه "خضروات"، بينما أن Wa ch zod rea يعود الى"كائنات بحرية قد يأكلها الحوت". هذه الادعاءات رائعة، وإذا كانت صحيحة، فقد يكون لها آثار مهمة على الأمن وقابلية التفسير لهذا النوع من نماذج الذكاء الاصطناعي الكبيرة. إذن ما الذي يحدث بالضبط؟

هل لدى DALL-E 2 لغة مخفية؟

يبدو أن DALL-E 2 ليس لديه "لغة سرية". ربما يكون من الأدق أن نقول أنه فعل ذلك مفردات خاصته - ولكن لا يمكننا أن نعرف ذلك على وجه اليقين أيضًا.

بادئ ذي بدء، في هذه المرحلة، من الصعب جدًا التحقق من أي ادعاءات حول ذلك DALL-E 2 ونماذج أخرى كبيرة من الذكاء الاصطناعيلأن عددًا قليلاً فقط من الباحثين والمهنيين المبدعين يمكنهم الوصول إليها. أي صور تتم مشاركتها علنًا (على تويتر على سبيل المثال) يجب أن يتم التقاطها بقدر كبير من الشك، حيث يتم "انتقاؤها" بواسطة إنسان من بين العديد من الصور الناتجة التي تم إنشاؤها بواسطة الذكاء الاصطناعي.


حتى أولئك الذين لديهم إمكانية الوصول لا يمكنهم استخدام هذه النماذج إلا بطرق محدودة. على سبيل المثال، يمكن لمستخدمي DALL-E 2 إنشاء الصور أو تعديلها، لكن لا يمكنهم (حتى الآن) التفاعل بشكل أعمق مع نظام الذكاء الاصطناعي، على سبيل المثال عن طريق تغيير التعليمات البرمجية خلف الكواليس. وهذا يعني أن الأساليب "الذكاء الاصطناعي القابل للتفسير"لا يمكن تنفيذ فهم كيفية عمل هذه الأنظمة، كما أن إجراء تحقيق منهجي في سلوكها يمثل تحديًا.

اذا ما الأمر؟

أحد الاحتمالات هو أن العبارات "الرطانة" مرتبطة بكلمات من لغات أخرى غير الإنجليزية. مثلا، أبوبلويوالتي يبدو أنها تستحضر صور الطيور تشبه اللاتينية apodidae، وهو الاسم ذو الحدين لعائلة من أنواع الطيور. هذا يبدو وكأنه تفسير معقول. على سبيل المثال، تم تدريب DALL-E 2 على مجموعة واسعة جدًا من البيانات المأخوذة من الإنترنت، والتي تضمنت العديد من الكلمات غير الإنجليزية.

لقد حدثت أشياء مماثلة في الماضي: نماذج ذكاء اصطناعي كبيرة باللغة الطبيعية تعلمت بالصدفة كتابة كود الكمبيوتر دون تدريب متعمد.

هل الأمر كله يتعلق بالرموز؟

إحدى النقاط التي تدعم هذه النظرية هي حقيقة أن نماذج لغة الذكاء الاصطناعي لا تقرأ النص بالطريقة التي يقرأها البشر. وبدلاً من ذلك، يقومون بتقسيم نص الإدخال إلى "رموز" قبل معالجته.

للوصول إلى الرمز المميز  مختلفة لها نتائج مختلفة. إن التعامل مع كل كلمة كرمز يبدو وكأنه نهج بديهي، ولكنه يسبب مشكلة عندما يكون للرموز المميزة المتطابقة معاني مختلفة (مثل كيف أن كلمة "تطابق" (مباراة، ولكن أيضًا مجموعة في لعبة AB) تعني أشياء مختلفة في لعبة التنس أو في إشعال النار.).

من ناحية أخرى، فإن معاملة كل حرف كرمز مميز ينتج عددًا أقل من الرموز المميزة المحتملة، ولكن كل واحد منها ينقل معلومات أقل أهمية بكثير.

يستخدم DALL-E 2 (والنماذج الأخرى) نهجًا وسيطًا يسمى ترميز زوج من البايتات (ببي). يشير فحص تمثيلات BPE لبعض الكلمات المبهمة إلى أن هذا النهج يمكن أن يكون عاملاً مهمًا في فهم "اللغة السرية".

ليست الصورة كاملة

يمكن أن تكون "لغة الأسرار" أيضًا مجرد مثال على مبدأ "القمامة تدخل، القمامة تخرج". لا يمكن لـ DALL-E 2 أن يقول "لا أعرف ما الذي تتحدث عنه"، لذلك سيقوم دائمًا بإنشاء نوع من الصور من نص الإدخال المحدد.

وفي كلتا الحالتين، لا يقدم أي من هذه الاحتمالات تفسيرات كاملة لما يحدث. على سبيل المثال، يبدو الأمر وكأنه إزالة أحرف مفردة من الكلمات المبهمة يفسد الصور التي تم إنشاؤها بطرق محددة للغاية. ويبدو أن الكلمات الفردية المبهمة لا تجتمع بالضرورة لتنتج صور مركبة متماسكة (كما سيفعلون إذا كانت هناك بالفعل "لغة" سرية تحت الغطاء).

لماذا هو مهم

وبعيدًا عن الفضول الفكري، ربما تتساءل عما إذا كان كل هذا مهمًا حقًا.

الجواب نعم. تعد "اللغة السرية" الخاصة بـ DALL-E مثالاً على "الهجوم العدائي" ضد نظام التعلم الآلي: وهي طريقة لكسر السلوك المقصود للنظام عن طريق الاختيار المتعمد للمدخلات التي لا يتعامل معها الذكاء الاصطناعي بشكل جيد.

أحد أسباب تنفيذ مثل هذه الهجمات هو أنها تتحدى ثقتنا في النموذج. إذا قام الذكاء الاصطناعي بتفسير الثرثرة بطرق غير مقصودة، فقد يفسر أيضًا كلمات ذات معنى بطرق غير مقصودة. وهذا يسبب أيضًا مخاوف أمنية. تقوم مرشحات DALL-E 2 بإدخال النص لمنع المستخدمين من إنتاج محتوى ضار أو مسيء، ولكن "اللغة المخفية" للرطانة قد تسمح للمستخدمين بتجاوز هذه المرشحات.

كشفت دراسة حديثة "تبديل التعبيرات  بالنسبة لبعض نماذج الذكاء الاصطناعي - عبارات قصيرة لا معنى لها مثل "zoning Tap fiennes" التي يمكن أن تتسبب بشكل موثوق في قيام النماذج بكتابة محتوى عنصري أو ضار أو متحيز. هذا البحث هو جزء من الجهد المستمر لفهم والسيطرة في الطريقة التي تتعلم بها أنظمة التعلم العميق المعقدة من البيانات.

أخيرًا، تثير ظواهر مثل "اللغة السرية" لـ DALL-E 2 مخاوف بشأن التفسير. ونحن نريد لهذه النماذج أن تتصرف كما هو متوقع، ولكن رؤية مخرجات منظمة في الاستجابة للثرثرة يربك توقعاتنا.

تسليط الضوء على المخاوف القائمة

ربما تتذكر الضجة التي نشأت في عام 2017 حول بعض روبوتات الدردشة على فيسبوك والتي "اخترعوا لغتهم الخاصة". الوضع الحالي مشابه من حيث أن النتائج مثيرة للقلق - ولكن ليس بمعنى أن "Skynet قادم للسيطرة على العالم".

وبدلاً من ذلك، تسلط "اللغة السرية" لـ DALL-E 2 الضوء على المخاوف الحالية بشأن متانة وأمان وقابلية التفسير. أنظمة التعلم العميق.

لمقالة في المحادثة

المزيد عن الموضوع على موقع العلوم:

תגובה אחת

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.