من هو الأكثر إبداعاً في اختبارات "التفكير المتفرع" - البشر أم نماذج اللغة الكبيرة؟

قامت مجلة التقارير العلمية بدراسة القدرة على توليد الأفكار والأصالة، والسؤال العملي هو متى يوسع النموذج الإبداع ومتى يقلله.

الذكاء الاصطناعي والإبداع. صورة توضيحية: depositphotos.com
الذكاء الاصطناعي والإبداع. الرسم التوضيحي: موقع Depositphotos.com

دراسة جديدة نشرت فيتقارير علمية تُجري هذه الدراسة فحصًا منهجيًا لأداء نماذج اللغة الكبيرة (LLMs) في المهام الإبداعية مقارنةً بالبشر، مع التركيز على اختبارات الاستدلال المتفرع - وهي أداة نفسية شائعة لقياس القدرة الإبداعية. وتثير النتائج تساؤلات مهمة حول دور هذه النماذج في العمليات الإبداعية: هل تُعزز الإبداع البشري أم تحل محله؟

التفكير المتفرع كمقياس للإبداع

على الرغم من أن الإبداع مفهوم يصعب تحديده بدقة، إلا أنه يُقاس في علم النفس من خلال اختبارات معيارية. ومن المفاهيم الأساسية فيه التفكير التبايني، أي القدرة على طرح مجموعة واسعة من الأفكار المختلفة لحل مشكلة مفتوحة، مع ابتكار حلول لا تقتصر على مجرد تنويعات على الفكرة الأساسية نفسها.

تتضمن الاختبارات النموذجية مهامًا مثل "كم عدد الاستخدامات المختلفة التي يمكن اقتراحها لشيء بسيط" أو "كم عدد الحلول الممكنة لموقف معين". عادةً ما يتم قياس الأداء في هذه الاختبارات على طول ثلاثة أبعاد رئيسية: الطلاقة (عدد الأفكار التي تم توليدها)، والمرونة (عدد فئات الأفكار المختلفة)، والأصالة (مدى ندرة الفكرة بالنسبة لمجموعة الإجابات).

التحدي المنهجي: القياس بدون تحيز

مع ظهور نماذج اللغة الضخمة، برز توتر بحثي مثير للاهتمام. فمن جهة، تتفوق هذه النماذج في توليد القوائم والأفكار بسرعة فائقة. ومن جهة أخرى، هناك رأي يقول إنها عرضة للتأثيرات الإحصائية، والعبارات المبتذلة، والأنماط التي ظهرت في بيانات التدريب الخاصة بها.

يتمثل التحدي الرئيسي في هذه الدراسة في تجنب أن يعكس القياس بشكل أساسي "سرعة الكتابة" وليس الإبداع الحقيقي. إذ يمكن للنماذج أن تتفوق بسهولة في مقياس الطلاقة لمجرد قدرتها على إنتاج النصوص بسرعة. لذلك، وفقًا لـ إعلان بحثي على موقع يوريك أليرت!من الضروري وضع النماذج مقابل مقاييس تعاقب التكرار ومطالبتها بتجنب الاستجابات المتوقعة.

الأصالة الإحصائية لا تعني القيمة الإبداعية

حتى لو حصل نموذج لغوي على درجة عالية في الأصالة وفقًا للخوارزميات الإحصائية، فإن هذا لا يدل بالضرورة على إبداع ذي قيمة بشرية. فقد تكون الفكرة نادرة إحصائيًا، لكنها تفتقر إلى الفائدة العملية أو الأهمية.

بالإضافة إلى ذلك، تم اكتشاف العديد من القضايا المنهجية الهامة:

يعتمد ذلك على صياغة الموجهقد يؤدي تغيير طفيف في الصياغة إلى تغيير جذري في النتيجة، مما يثير التساؤل عما إذا كان المؤشر يعكس قدرة النموذج أم مهارات واضع المبادئ التوجيهية.

تأثير التثبيتتميل النماذج أحيانًا إلى إنشاء تسلسلات متأثرة بالأمثلة الأولى التي تنتجها، على غرار البشر الذين قد يعلقون في نمط تفكير واحد. والسؤال المهم هو ما إذا كانت هذه النماذج تُنتج نطاقًا واسعًا من الأفكار حقًا، أم مجرد اختلافات حول نمط مركزي واحد.

المعنى العملي: أداة تكميلية أو بديلة

إنّ النهج المثمر لهذا البحث لا يقوم على فكرة "الإنسان ضد الآلة"، بل على فهم الظروف التي تُسهم فيها نماذج اللغة في الإبداع البشري. فإذا تفوّق نموذج ما في تدفق الأفكار، فإنه يُمكن أن يعمل كـ"محرك للأفكار الأولية"، حيث يُنتج مجموعة واسعة من الأفكار الأولية التي يختار منها البشر ويُدمجونها ويُصفّونها.

مع ذلك، إذا لم يكن النموذج مرنًا حقًا، فقد يُوهم بالإبداع: نصٌّ كثيرٌ مع قليلٍ من الإنجازات الحقيقية. تكمن الفائدة العملية في فهم أنواع المهام المفتوحة التي يُسهم فيها النموذج بشكلٍ أكبر، مقابل تلك التي يُحفز فيها على التقارب المبكر نحو أفكارٍ متشابهة.

قيود البحث ومناقشة أوسع

ينبغي النظر إلى النتائج في سياقها المنهجي المناسب. وتُعاني الدراسة من عدة قيود، منها طبيعة العينة المدروسة، واللغة المستخدمة في الاختبارات، والنموذج المحدد الذي تم اختباره. علاوة على ذلك، يُعدّ مصطلح "نموذج اللغة" فئة واسعة، إذ تختلف النماذج في أدائها، بل وقد يتغير النموذج نفسه مع التحديثات التقنية.

لذا، من المناسب اعتبار هذه النتائج بمثابة برهان منهجي لا قرار نهائي بشأن القدرة الإبداعية لنماذج اللغة. وتُعدّ هذه الدراسة جزءًا من نقاش أوسع حول كيفية تأثير تقنيات الذكاء الاصطناعي على العمليات الإبداعية في التعليم والعمل ومجالات أخرى.

المزيد عن الموضوع على موقع العلوم:

تعليقات 3

  1. بالتأكيد، لقد انطلق البشر - النظرية الشاملة للعلوم الدقيقة والهندسة والفيزياء، القائمة على المعرفة الطبيعية للجهاز العصبي - بينما لا يمتلك الذكاء الاصطناعي أي معرفة طبيعية.

  2. إن الفهم الكامل ليس إبداعياً، وكل ما يفعله هو ترديد آراء الجموع.
    وبالتالي فإن الذكاء الاصطناعي يعيق الإبداع.

    أ. أسبار

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismet لتصفية التعليقات غير المرغوب فيها. مزيد من التفاصيل حول كيفية معالجة المعلومات الواردة في ردك.