تغطية شاملة

إذن ماذا تفعل هناك في الجامعة؟ الفصل السابع: تدريب بكمن على تسجيل الأهداف - حول الروبوتات التطورية

التقيت شلومي إسرائيل لأسأله عما يجري هناك في الجامعة

شلومي يقترب من إنهاء درجة الماجستير في الهندسة الكهربائية في جامعة تل أبيب. أجرى بحثه تحت إشراف الدكتور عميرام موشيوف من كلية الهندسة الميكانيكية، وينصب تركيزنا الرئيسي على الروبوتات التطورية. حصل على شهادته الأولى في التخنيون في الهندسة الكهربائية والفيزياء. شلومي، الذي كان حتى وقت قريب مقيمًا دائمًا، متزوج ويعيش مع زوجته وابنته في حيفا. في أوقات فراغه، يحب الاستماع إلى البودكاست، وبدأ مؤخرًا في لعب الفريسبي المطلق، وهو نوع من التقاطع بين الفريسبي وكرة القدم الأمريكية.

مرحباً، ماذا تفعل هناك؟

نحن نتعامل مع مزيج من مجالين: الروبوتات التطورية والتحسين متعدد الأهداف. أعلم أن المفاهيم صعبة ولكن لا تقلق، فسنقوم بتحليلها ببطء وبعناية.

الصورة 1: روبوت ذو محرك تفاضلي تم تطويره في معهد جورجيا للتكنولوجيا. مصدر الصورة: ويكيبيديا.
الصورة 1: روبوت ذو محرك تفاضلي تم تطويره في معهد جورجيا للتكنولوجيا. مصدر الصورة: ويكيبيديا.

فلنبدأ بسؤال ما هي الروبوتات؟

الروبوتات التي نتعامل معها هي كيانات لديها القدرة على استشعار المدخلات حول العالم من حولها والتفاعل وفقًا لقوانين معينة. يمكن أن تكون المدخلات، على سبيل المثال، أجهزة استشعار تقيس المسافة من الحائط أو الكرة ويمكن أن يكون الإخراج حركة. تتم الحركة في الروبوتات الخاصة بنا بواسطة محرك تفاضلي بمساعدة عجلتين. بين المدخلات والمخرجات هناك وحدة تحكم تحدد كيفية التصرف للمدخلات المختلفة. تحتوي وحدة التحكم على معلمات خارجية يمكن تغييرها والتأثير على سلوك الروبوت.

على الرغم من أن هذه الروبوتات تتحرك في الفضاء، إلا أن كلا من الروبوتات والفضاء عادةً ما يكونان في محاكاة حاسوبية. ومع ذلك، فإن أجهزة الاستشعار والدفع وأجهزة التحكم الخاصة بالروبوتات تعتمد على الأجهزة الحقيقية ويمكن نقل النظام بسهولة نسبية إلى العالم الحقيقي. إذا أخذنا جهاز Roomba على سبيل المثال، فمن المحتمل أنه قبل إنشائه لأول مرة تم اختباره كبرنامج كمبيوتر يقوم بتنظيف غرفة افتراضية بالكامل، ولم يتم بناؤه إلا بعد أن أظهر أداءً جيدًا هناك.

الصورة 2: جهاز Roomba عند نقطة الإرساء. مصدر الصورة: ويكيبيديا.
الصورة 2: جهاز Roomba عند نقطة الإرساء. مصدر الصورة: ويكيبيديا.

حسنًا، ما هي الروبوتات التطورية؟

يحدد المشغل البشري هدفًا فائقًا للروبوتات التي لم يتم برمجتها مسبقًا عليها. يتم إجراء التجربة في ساحة يتنافس فيها مجموعة عشوائية من الروبوتات لتحقيق الهدف، وبعد عدة مسابقات يتم فحص أداء الروبوتات. على سبيل المثال، إذا كان الهدف النهائي هو الانتقال من النقطة أ إلى النقطة ب، فإننا نتحقق من أي الروبوتات هو الأقرب. من أكثر الروبوتات نجاحًا، يقومون بإنشاء الجيل التالي من الروبوتات، عندما يقومون بتكرار وحدات التحكم الخاصة بهم بتغييرات عشوائية، بل ويجمعون وحدات تحكم مختلفة في نوع من الاقتران. عادة ما يتم تحديد فرصة حدوث الطفرات مسبقًا من خلال نماذج تمت دراستها مسبقًا. تنتهي التجربة بعد عدة أجيال ولكن بعد ذلك يتم إعادة إجرائها عدة مرات لأن بيانات البداية عشوائية ونتائج التجربة الواحدة تختلف من تشغيل لآخر.

تتيح الروبوتات التطورية تطوير وحدات تحكم معقدة للغاية بكفاءة. لكن الهدف العام للبحث هو الهندسة - لتطوير الأساليب التي يمكننا من خلالها تصميم الروبوتات التي ستتعامل بسهولة أكبر مع مجموعة متنوعة من الظروف البيئية التي لم يتم تحديدها مسبقًا. وهذا لا يعني تطوير الروبوت المثالي، بل تطوير العملية المثلى لتدريب الروبوتات على المهام المطلوبة.

وما هو التحسين متعدد الأهداف؟

عند إجراء التحسين، يجب تحديد وظيفة موضوعية تخبرنا بمدى نجاح الروبوت. على سبيل المثال، إذا كان الهدف هو الانتقال من النقطة أ إلى النقطة ب، فكلما اقترب الروبوت من النقطة ب، زادت النتيجة. في التحسين متعدد الأهداف، يتم تعريف العديد من الوظائف الموضوعية. إذا فكرنا في Pacman على سبيل المثال، فإن أحد أهدافه هو تناول أكبر عدد ممكن من النقاط والفواكه، والهدف الثاني هو الحفاظ على أكبر عدد ممكن من Pacmen على قيد الحياة.

عادة ما تأتي الأهداف المختلفة على حساب الآخر، وإلا فإننا قد نكتفي بواحد منهم فقط. على سبيل المثال، إذا قام Pacman بمخاطرة كثيرة جدًا من أجل تناول الكثير من الفواكه، فمن المحتمل أنه سينهي اللعبة بسرعة بسبب مواجهاته المتكررة مع الشياطين. ولكن إذا لم يخاطر على الإطلاق، فلن يأكل الفاكهة. وللمشكلة مجموعة من الحلول المثلى، تختلف في تركيبها ولكنها متساوية في الجودة. هدفنا هو جلب النظام إلى أحد هذه الحلول. وطالما أنه من الممكن تحسين هدف واحد دون الإضرار بهدف آخر، فإننا نعلم أننا لم نجد بعد أحد الحلول المثلى (في اللغة: البحث في جبهة باريتو).

الصورة 3: لقطة شاشة للعبة Pacman من هذا الموقع.
الصورة 3: لقطة شاشة للعبة Pacman من هذا الموقع.

وكيف تربط تعدد الأهداف بالتطور؟

وفي حالة التحسين متعدد الأهداف، فإن الروبوتات التي ستشكل الجيل القادم ستختار وفقًا لعدة أهداف فائقة، باستخدام التحليل الذي وصفته سابقًا. على سبيل المثال، يمكننا تحديد هدفين عظيمين: الانتقال من النقطة أ إلى النقطة ب وجمع أكبر عدد ممكن من العناصر في الطريق. نظرًا لأن هذين الهدفين متعارضان، فمن المحتمل أنه في نهاية العملية لن تتفوق الروبوتات في أي من الأهداف الفردية ولكنها ستظهر نوعًا من التسوية المثالية.

إذًا ما الذي يمكن استكشافه مع كل هذه الروبوتات؟

سأعطيكم مثالا على ذلك. قبل بضع سنوات، نُشرت دراسة ركضت فيها الروبوتات في ساحة يوجد فيها عنصران مهمان: نقاط الطعام ونقاط السم. الهدف الشامل للمخطط، غير المعروف للروبوتات، هو البقاء لأطول فترة ممكنة في نقاط الطعام وتجنب نقاط السم. يمكن للروبوتات أن ترسل إشارات لبعضها البعض بالضوء، دون أن يتم تحديد معنى الإجراء بالنسبة لها.

تم اختيار الروبوتات لتجميع الجيل القادم في الدراسة بإحدى طريقتين: إما وفقًا لنجاح الروبوتات الفردية أو وفقًا لنجاح المجموعة. أشارت نتائج الدراسة إلى أنه في الحالات التي يتم فيها الحكم على النجاح من قبل مجموعة، طورت الروبوتات القدرة على الإشارة "يا شباب، تعالوا إلى هنا، يوجد طعام هنا!". الروبوتات التي طورت اتصالاً بين الإشارة وموقع الطعام هي التي انتقلت إلى الأجيال القادمة. من ناحية أخرى، في الحالات التي يتم فيها الحكم على النجاح من خلال الروبوتات الفردية، إما أن الإشارة لم تتطور إلى شيء ذي معنى أو أنها تطورت إلى إشارة غرضها مضلل، على سبيل المثال الإشارة بالقرب من السم، وذلك لوجود منافسة على موارد.

أي أنه في تجربة بسيطة إلى حد ما، تمكن الباحثون من جعل الروبوتات تطور سلوكًا معقدًا للغاية، سلوكًا يطابق ما نراه في الطبيعة.

أخبرني باختصار عما تفعله في بحثك.

مرح. نقوم بتدريب فريقين من الروبوتات للعب نسخة بسيطة من كرة القدم، أي أن الهدف هو تسجيل الأهداف. كما ذكرت سابقًا، بدأت التجربة مع مجموعة سكانية عشوائية. ولكن ما هي فرصة أن يتمكن مثل هؤلاء السكان من تسجيل هدف واحد؟ وإذا فشلت جميعها، فكيف نختار الروبوتات الناجحة للجيل القادم؟ من الممكن، بالطبع، تحديد أهداف أكثر تركيزًا، لكننا في الواقع نعمل بالفعل على هندسة الحل وهذا أمر خاطئ بعض الشيء لغرض التجربة. لدينا مشكلة في التمهيد هنا - تهيئة التجربة. نهجنا في الحل هو فصل المشكلة العامة عن مشكلة التهيئة. بالنسبة لمشكلة التهيئة، قمنا بتحديد أهداف متوسطة، ومهاجمتها باستخدام التحسين متعدد الأهداف.

وباستخدام الأساليب الإحصائية، تمكنا من إظهار أن الطريقة التي طورناها تحقق نتائج أفضل (على سبيل المثال، عدد أكبر من المغتربين) مقارنة بالطرق المقبولة الأخرى في ظل ظروف تشغيل مماثلة.

--------------------

يسعدني أن ألتقي وأتحدث مع أي طالب بحث (ربما أنت؟) يرغب في المشاركة ويخبرني قليلاً عما يفعله (وكل ذلك مقابل محادثة ليست طويلة جدًا). يمكنك الاتصال بي من خلال نموذج الاتصال.

حان الوقت لتخبر الجميع بما تفعله، ربما سيفهمون هذه المرة أيضًا 🙂

تعليقات 7

  1. مرحبًا رام،
    سؤالك مثير للاهتمام وقد شارك فيه العديد من الباحثين.
    أفضل إجابة وصلتني هي إجابة الباحث توماس ميكوني الذي خصص فصلاً لهذا الأمر في أطروحته للدكتوراه. ما يعجبني فيه هو القدرة على الموازنة بين الكتابة العلمية الصارمة وإبقاء النص قابلاً للقراءة وسلسًا، لذلك إذا كنت مهتمًا حقًا بالموضوع فسوف تستمتع بالقراءة (انظر الفصل 8):
    http://etheses.bham.ac.uk/148/

    من حيث الحجم، فإن الخطأ الشائع هو إدراك الزيادة في التعقيد على أنها تقدم مدفوع (موجه)، في حين يمكن اعتبارها تقدمًا سلبيًا يحدث في وقت واحد مع تراجعات في التعقيد (انظر الرسم البياني 8.1).

  2. الظاهرة التي تصفها - انخفاض التعقيد تحدث طوال الوقت، ونحن لا نشعر بها، لأنه من الصعب علينا أن نعرف أي المخلوقات كانت أكثر تعقيدًا في السابق. وحتى في هذه الحالة، يكون البقاء للأصلح، خذ على سبيل المثال المخلوقات التي تسقط في كهف وتفقد أعينها، وتتكيف مع بيئتها.

  3. حسنًا، الأسئلة التي لا تتعلق مباشرة بالموضوع، لكنني أحاول فهم التطور. ويرجى عدم توجيه الاتهامات حول التصميم الذكي، فأنا أحاول فقط أن أفهم كيف يتم إنشاء التعقيد.

    إن آلية التطور العمياء خلقت البشر في مليارات السنين الأخيرة (قمة الخليقة حسب الله، ذروة التعقيد حتى الآن حسب التطور. أم أنني مخطئ؟) ولكن من الناحية النظرية من الممكن تخيل أو وصف موقف ما حيث تملي *الظروف* انخفاضًا في التعقيد، وفقدان الوعي، وتفكك العديد من الخلايا إلى خلايا مفردة أو حتى جزيئات ذرية. هل ستظل النظرية تسميها البقاء للأصلح؟

    والمزيد عن موضوع التعقيد: لنفترض أن هناك كائنًا حيًا يعتمد على السكر، وانخفض مستوى السكر. يدعي التطور أنه في يوم من الأيام، في ظل ظروف معينة (ليس لدينا القدرة على التنبؤ بها)، سوف يطور الكائن الحي القدرة على العيش بكمية أقل من السكر أو بدونه. وبنفس الطريقة، ولأن الآلية عمياء، ففي عينات أخرى سينقرض الكائن الحي، أو ستنخفض كميته، أو ستتطور لديه القدرة على الوجود على شيء مختلف تماماً. وهذا يعني، إحصائيًا، أن مستوى التعقيد - مقابل التباين - لن يتغير. إذن، أين، من الناحية المفاهيمية، هل تتناسب مع قصة الحركة التي نراها على الأرض نحو التعقيد؟

    ماذا ينقصني؟ ربما كل ما أحتاجه هو توصية لكتاب جيد...

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.