تغطية شاملة

قفزة شاقة

يمكن لسائق آلي وطائرة هليكوبتر صغيرة القيام بحركات خطيرة بعد "تعلم" البرنامج: هل سيكون بمقدورهما منع المواقف الخطيرة في المستقبل؟

المروحية الروبوتية في العمل. الصورة: يوجين فراكتين، جامعة ستانفورد
المروحية الروبوتية في العمل. الصورة: يوجين فراكتين، جامعة ستانفورد

إسرائيل بنيامين جاليليو

في دوران 180 درجة وتوقف بالضبط بين سيارتين متوقفتين. هذه حركة خطيرة، والتي لا تظهر عادة إلا في أفلام الحركة أو عروض القيادة، ولكن هذا هو أيضًا التحدي الذي واجهه "فريق ستانفورد ريسينغ". وعلى عكس ما يوحي به اسمها، فهذه ليست مجموعة من سائقي السباقات، بل مجموعة من علماء الكمبيوتر، المنخرطين في تطوير السيارات الآلية - الآلات التي يمكنها قيادة نفسها.

وفي مايو 2010، قدمت المجموعة نتائج أحدث أبحاثها في المؤتمر الدولي للروبوتات والأتمتة الذي عقد في أنكوراج، ألاسكا. لقد قاموا بتعليم سيارتهم الآلية، جونيور، كيفية أداء حيلة حديقة التزلج، كما ترون في مقطع الفيديو الذي نشروه.

لماذا يجب عليك تعليم مركبة آلية أداء الأعمال المثيرة الخطيرة؟ هل هو لتسهيل إنتاج أفلام الأكشن؟ أو ربما حتى يتمكن كل واحد منا من أخذ المكان النادر الذي نجده أمامه، قبل أن تتسلل سيارة أخرى إلى ذلك المكان؟ وكما سنرى لاحقا، هناك أسباب أفضل.

جونيور، روبوت ذو ماضٍ لامع

يقدم الطالب الذي سجل في الدراسات المثيرة، جونيور، سيرة ذاتية مثيرة للإعجاب بالنسبة لصغر سنه. وتم بناؤه من قبل مجموعة ستانفورد للسباقات، التي تضم أعضاء من قسمي الذكاء الاصطناعي والهندسة بجامعة ستانفورد في كاليفورنيا، بالإضافة إلى باحثين ومهندسين من شركات السيارات (تويوتا، فولكس فاجن) والتكنولوجيا (بوش، إنتل). فاز ستانلي، الأخ الأكبر لجونيور، بمسابقة "التحدي الكبير" عام 2005 وجلب لمطوريها جائزة قدرها مليوني دولار.

تم تأسيس هذه المسابقة من قبل DARPA، وكالة مشاريع الأبحاث المتقدمة التابعة لوزارة الدفاع الأمريكية، لتطوير التكنولوجيا من خلال وضع تحدي تكنولوجي يعارضها. وأكملت ستانلي، التي بدأت حياتها كسيارة فولكس فاجن طوارق، مسارًا صحراويًا صعبًا لأكثر من مائتي كيلومتر في أقل من سبع ساعات، أي أقل بعشر دقائق من السيارة التي طورها فريق من جامعة كارنيجي ميلون. يتم عرض ستانلي اليوم في متحف سميثسونيان للتاريخ الأمريكي في واشنطن.

رفعت مسابقة التحدي الكبير لعام 2007 مستوى الصعوبة، وتطلبت من المتنافسين إكمال طريق حضري يبلغ طوله حوالي 100 كيلومتر بنجاح مع الاندماج مع حركة المرور والالتزام بالقوانين واللافتات. هذه المرة انتقم فريق كارنيجي ميلون عندما أكملت سيارتهم الآلية "Boss" الدورة بنجاح في أربع ساعات وعشر دقائق. وصل جونيور، الروبوت الذي صنعته مجموعة ستانفورد على أساس سيارة فولكس فاجن باسات، بعد عشرين دقيقة وفاز بالجائزة الثانية - مليون دولار.

حلقات مغلقة

وفي الورقة الفنية المقدمة في المؤتمر، يشرح أعضاء فريق السباق الطريقة التي استخدموها لتعليم جونيور أداء الحركة. أنظمة التحكم، مثل تلك المستخدمة لقيادة السيارة الآلية، عادة ما تكون مدعومة بنموذج رياضي للنظام الذي نريد التحكم فيه - في هذه الحالة، السيارة. يتضمن النموذج تمثيلاً رياضيًا لسلوك السيارة في المواقف المختلفة واستجابةً لإجراءات التحكم المختلفة.

لذلك، على سبيل المثال، إذا أدخلنا معلومات في النموذج بأن السيارة تتحرك على السرعة الرابعة وبسرعة 60 كم/ساعة وفي خط مستقيم على مسار مسطح (تمثيل للحالة)، وعجلة القيادة مائلاً بزاوية 7 درجات إلى اليسار مع الضغط بنسبة 10% على الفرامل (تمثيل لإجراءات التحكم)، سيتنبأ النموذج بسلوك السيارة بعد جزء من مائة من الثانية: إلى أي مدى ستنخفض سرعة السيارة، وفي أي اتجاه سيتم تدويره، ما هي سرعة دورانه (معدل تغير الزاوية)، وما إلى ذلك.

تتولى أنظمة البرامج الأخرى في السيارة الآلية مسؤولية تخطيط المسار المطلوب وتحديد مدى سرعة التحرك عند كل نقطة على الطريق. وظيفة نظام التحكم هي تشغيل المركبة بحيث تتحرك حسب التصميم. بمساعدة النموذج الرياضي، من الممكن العثور على إجراءات التحكم المطلوبة للانتقال من الحالة الحالية إلى الحالة المطلوبة في جزء من مائة من الثانية (أو فترة زمنية قصيرة أخرى)، والاستمرار على هذا النحو حتى يتم وضع الخطة. تم تنفيذها بنجاح.

في الواقع، لا يمكن للنموذج أن يكون دقيقًا تمامًا. ستكون هناك دائمًا أخطاء صغيرة في النموذج نفسه أو في تنفيذ إجراءات التحكم (على سبيل المثال، تحريك عجلة القيادة بمقدار 7.03 درجة بدلاً من 7 درجات)، وتغييرات طفيفة في ظروف الطريق (انبعاج بسيط، على سبيل المثال)، وما إلى ذلك، مما يتسبب في انحراف السيارة إلى حد ما عن الخطة في نهاية المائة من الثانية التالية.

مثل هذه الانحرافات، مهما كانت غير محسوسة، ستتراكم خلال الثواني القليلة التالية وستؤدي في النهاية إلى وصول السيارة إلى مكان وحالة مختلفة تمامًا عما كان مخططًا له. ولمنع تراكم الأخطاء، تم تجهيز السيارة أيضًا بأجهزة استشعار تقيس وضع السيارة وحالتها في كل لحظة. يقوم برنامج التحكم بمقارنة المعلومات الواردة من أجهزة الاستشعار بالمعلومات التي يراها النموذج ويستخدم المعلومات لتكييف إجراءات القيادة مع الوضع الحقيقي.

هذه عملية تحكم تعتمد على حلقة مغلقة: لا يتوقع النظام سلوك السيارة ويخطط لتصرفاتها وفقًا لذلك فحسب، بل يقوم أيضًا بتصحيح التخطيط وفقًا لردود الفعل الواردة من أجهزة الاستشعار ويسمح له بقياس نتائجها بشكل أكثر دقة. أجراءات. هذه العملية ليست بسيطة، ويجب على المرء أن يأخذ في الاعتبار، من بين أمور أخرى، أن أجهزة الاستشعار نفسها ليست مثالية، لذلك من المتوقع وجود أخطاء صغيرة ("الضوضاء") في المعلومات التي تقدمها. ومع ذلك، وكما أظهرت الروبوتات التي شاركت في مسابقة التحدي الكبير، يمكن تحقيق نتائج مبهرة بهذه الطريقة.

حلقات مفتوحة

إحدى المشاكل المتعلقة بطريقة الحلقة المغلقة هي الحاجة إلى نموذج ذو موثوقية عالية، حتى لو لم يكن لديه دقة كاملة. في كثير من الأحيان يتم إنشاء النموذج من خلال التعلم من تسجيلات النظام أثناء العمل. وهذه أيضًا هي الطريقة التي عمل بها فريق السباق: لقد سجلوا عدة دقائق من القيادة البشرية في السيارة، حيث تم قياس موضع السيارة وحالتها بالإضافة إلى تصرفات السائق في كل لحظة، وحسبوا النموذج من هذا التسجيل. تعمل هذه الطرازات بشكل جيد عندما تكون السيارة في مواقف مشابهة لتلك المسجلة أثناء قيادة الإنسان، وعندما يكون معدل التغيير منخفضًا - بدون فرملة حادة، أو انعطاف حاد لعجلة القيادة، وما إلى ذلك.

عندما تكون التغيرات في حالة السيارة وتصرفات السائق سريعة، يفقد النموذج موثوقيته. أحد أسباب ذلك هو زيادة الأخطاء، ولكن هناك أيضًا سبب أعمق: لنفترض أن النموذج الذي تم تعلمه من تسجيل الحركة بسرعة 40 كم/ساعة ودوران قدره 20 درجة في الثانية يمكنه التنبؤ بدقة عالية بالاستجابة للحركة. بسرعة 50 كم/ساعة وبدوران 30 درجة في الثانية. ومع ذلك، فإن النموذج الذي تم تعلمه من تسجيل الحركة بسرعة 40 كم/ساعة وبدوران انزلاقي قدره 180 درجة في الثانية لن يكون قادرًا على التنبؤ بسلوك السيارة بنفس السرعة ومع تغيير طفيف في معدل الدوران - مثلاً 170 درجة في الثانية.

ومع أن التغير في الحالة الثانية يكون أصغر (نفس السرعة تغير حوالي 5% في معدل الدوران في الحالة الثانية، مقارنة بتغير 25% في السرعة ومعدل الدوران في الحالة الأولى)، في الحالة الثانية أن تكون المركبة في حالة حساسة للغاية لأي تغيير في التحكم، لذا فإن النموذج لا يسمح بحساب الاستجابة لمثل هذه التغييرات.

ولذلك، في مثل هذه الحالات القصوى، لا يكون التحكم في الحلقة المغلقة مناسبًا، لأنه من المستحيل تغذية ردود الفعل من أجهزة الاستشعار إلى النموذج لحساب التصحيح المطلوب في كل لحظة. للعثور على طريقة تحكم أفضل، استفاد المطورون من نتيجة أخرى ظهرت من بحثهم: على الرغم من صعوبة التنبؤ بسلوك السيارة مسبقًا في المواقف القصوى، إلا أنه يعيد نفسه: إذا تصرف السائق بنفس الطريقة تمامًا (نفس السرعة) ، نفس الدوران الحاد لعجلة القيادة، نفس قوة الكبح) كما فعل في وقت التسجيل، ستتحرك السيارة على طريق مشابه جدًا للمسار السابق.

تؤدي هذه النتيجة إلى التحكم في الحلقة المفتوحة: الوصول إلى حالة مماثلة للحالة المسجلة والتكرار الدقيق لإجراءات التحكم المسجلة. لتفعيل هذه الطريقة، سجل المطورون تصرفات السائق الذي يقوم بقفل العجلات أثناء القيادة إلى الخلف ويقوم بالدوران بمقدار 180 درجة. ومن المثير للاهتمام التأكيد على أن السائق البشري لم يكن مطالبًا بأداء حركة ركن السيارة، وبالتالي لم يوجه الإجراء بحيث ينتهي بالضبط في مكان معين محدد مسبقًا. وقام البرنامج بتنفيذ الحيلة من خلال حساب الاتجاه والمكان الذي سيتم الوصول إليه، بالسرعة المناسبة، بحيث يؤدي تكرار الإجراءات المسجلة للسائق إلى التوقف عند مكان ركن السيارة المطلوب.
مزيج مفتوح ومغلق

كما ترون في الفيديو في الرابط المرفق، فإن التحكم باستخدام طريقة الحلقة المفتوحة يتمكن من الوصول إلى الوضع المطلوب (دوران 180 درجة) ولكن ليس إلى الموقع المطلوب. والسبب في ذلك هو أن نظام التحكم في الحلقة المفتوحة يتراكم عليه الأخطاء أثناء القيادة، وذلك بسبب عدم تصحيح التصميم حسب ردود الفعل من أجهزة الاستشعار. من أجل تحقيق تنفيذ مثالي لهذه المهمة، اختار المطورون الجمع بين الطريقتين: تصل السيارة إلى نقطة بداية الدوران تحت التحكم في الحلقة المغلقة، وهو ما يتوافق مع الحالة المستقرة للقيادة "البسيطة"، وتتحول إلى التحكم في الحلقة المفتوحة عندما تترك السيارة المجال المستقر وتدخل في قفل العجلة وتدور. كما هو موضح في الورقة الفنية، يستخدم الجمع بين الطريقتين تقديرًا لدقة كل منهما في الحالة الحالية: تزداد دقة الحلقة المغلقة حيث تكون الحالة الحالية أقل حساسية للتغيرات الصغيرة في التحكم، وتزداد دقة الحلقة المغلقة عندما تكون الحالة الحالية أقل حساسية للتغيرات الصغيرة في التحكم، وتزداد دقة الحلقة المغلقة. تزداد الحلقة المفتوحة كلما اقتربت الحالة الحالية من الحالة المسجلة.

هذا المشروع ليس الوحيد المهتم بالأعمال الروبوتية المثيرة. أظهر فريق بحث آخر في جامعة ستانفورد في عام 2008 برنامجًا يؤدي أعمالًا مثيرة تبدو مستحيلة من خلال قيادة طائرة هليكوبتر بدون طيار. هنا أيضًا، وجدوا أنه من الضروري تعلم كيفية قيام المشغل البشري بالأعمال المثيرة، لكن البرنامج كان قادرًا على تعلم النمط المثالي من عدة عروض توضيحية، وبالتالي كان قادرًا على أداء الأعمال المثيرة بدقة أكبر من العرض البشري الأصلي .

وأوضح مطورو المروحية الآلية أن هناك حاجة حقيقية لمثل هذه البرامج للتأكد من أن الطيران الآلي سيكون آمنًا في أي موقف، حتى عندما تواجه الرحلة ظروفًا صعبة. وقد تجلت الحاجة إلى مثل هذه البراعة في يناير/كانون الثاني 2009، عندما اضطر الطيار تشيسلي سولينبرجر إلى الهبوط بطائرة في نهر هدسون بعد أن اصطدم بسرب من الإوز مما أدى إلى تعطيل محركات الطائرة. وبالمثل، يوضح أعضاء فريق السباق في جامعة ستانفورد أنهم طوروا القدرة على قيادة الأعمال المثيرة لإنشاء مركبة آلية قادرة على العمل بشكل صحيح حتى في المواقف الخطرة. إذا قاموا أيضًا بتعليم الروبوت التصرف بطريقة تتجنب مثل هذه المواقف قدر الإمكان، فمن المحتمل أن نتمكن في المستقبل من ترك عجلة القيادة في أيدٍ أكثر أمانًا من الأيدي البشرية.

يعمل Israel Binyamini في ClickSoftware لتطوير أساليب التحسين المتقدمة.
تم نشر المقال كاملا في مجلة جاليليو عدد أغسطس 2010

تعليقات 5

  1. مفهوم حلقات ردود الفعل مثير للاهتمام.
    تجدر الإشارة إلى أن هناك فرقًا بين تنشيط المكابح ("قفل" العجلات الأمامية / الخلفية) والتي في الواقع - نظرًا لثبات عجلة القيادة ومواضع دواسة الوقود - تضع السيارة على مسار حتمي، وبين دواسة الوقود ودواسة الوقود وضع عجلة القيادة (باستثناء القفل في وضع ثابت).
    يستطيع السائق البشري المدرب إجراء تصحيحات صغيرة على هاتين المعلمتين حتى أثناء المناورة.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.