تغطية شاملة

الروبوتات تتعلم

أوري كارتون، طالب يكمل حاليا دراسته الجامعية الثالثة في قسم الهندسة الصناعية والإدارة في جامعة بن غوريون، يقوم بتطوير خوارزميات الذكاء الاصطناعي التي يتم تطبيقها على الروبوتات

الشكل 1. ذراع آلية تتعلم كيفية تفريغ كيس يحتوي على متفجرات غير تقليدية (في ظل ظروف المختبر)

الشكل 1. ذراع آلية تتعلم كيفية تفريغ كيس يحتوي على متفجرات غير تقليدية (في ظل ظروف المختبر)

في قسم الهندسة الصناعية والإدارة في جامعة بن غوريون في النقب، وبتوجيه من البروفيسور هيلمان شتيرن والبروفيسور يائيل إيدن، يقوم أوري كارتون، الطالب الذي يكمل حاليا دراسته الجامعية الثالثة، بتطوير خوارزميات الذكاء الاصطناعي التطبيقية إلى الروبوتات. يتناول البحث الرئيسي لأوري كارتون تحسين الخوارزميات من مجموعة التعلم المعزز (RL)، وهو مجال فرعي للذكاء الاصطناعي. في RL، يعمل وكيل (على سبيل المثال، روبوت متنقل) في العالم أو في بيئة معينة. أثناء تنفيذ الإجراءات في البيئة، يتلقى الوكيل تعزيزات (تعزيزات) أو عقوبات (عقوبات)، وهي مؤشرات تشير إلى مدى رضا سلوكه. وفقا لهذه المؤشرات، يتعلم الوكيل كيفية التصرف في البيئة، وما هي المواقف التي من الأفضل تجنبها وما هي الإجراءات التي يفضل القيام بها.

طور أوري كارتون خوارزمية تسمى ، وهي خوارزمية تم تطبيقها على نظامين آليين: (1) ذراع آلية يتمثل دورها في الاستيلاء على حقيبة يشتبه في احتوائها على متفجرات غير تقليدية (مثل فيروسات السارس والجمرة الخبيثة والإيبولا) وإفراغها على سطح الاختبار (الشكل 1) و (2) روبوت متنقل للملاحة (الشكل 2). تسمح الخوارزمية المطبقة على النظام الآلي بالتحقق مما إذا كان مستوى التعلم الخاص به غير كافٍ أو إذا واجه موقفًا غير قابل للحل. في حالة حدوث هذا السيناريو، يتصل النظام بالشخص للحصول على المشورة. يقدم الشخص حلاً (استراتيجية) عندما يكون الافتراض هو أنه بحكم كونه شخصًا يتمتع بقدرة ذكاء تفوق قدرة النظام الآلي. يتم استقبال الحل الذي يقترحه الشخص من خلال واجهة مثبتة على نظام حاسوبي بعيد عن الروبوت حيث يمكن الاتصال بين الشخص والروبوت عبر الإنترنت أو عبر الاتصال عبر الأقمار الصناعية.

الاستراتيجية التي يقدمها الشخص تؤخذ بعين الاعتبار من خلال وظائف التعلم للروبوت وكلما زاد عدد مرات تدخل الشخص، كلما تحسن مستوى التعلم للروبوت وقل اعتماده على الشخص. عند نقطة معينة، يتناقص اعتماد النظام الآلي على البشر إلى حد أنه يتحول فعليًا من نظام شبه مستقل إلى نظام يتمتع باستقلالية كاملة، أي أن درجة التدخل البشري توفر مقياسًا للحكم على مستوى النظام الاستقلالية - كلما قل التدخل، زاد مستوى استقلاليتها، وأصبحت أكثر استقلالية ولديها ذكاء أكثر كفاءة.

يمكن تطبيق البحث الذي تم إجراؤه في قسم الصناعة والإدارة على التطبيقات التي طورتها وكالة ناسا، على سبيل المثال، محاولة فصل الألواح الشمسية وهزها في المحطة الفضائية في ديسمبر 2006. إذا كان من الممكن تعليم ذراع آلية هز الطاقة الشمسية لوحة على أرض الأرض أثناء التعامل مع مواقف مختلفة (مثل: تغيير الزوايا، مواد مختلفة، ظروف إضاءة مختلفة، إلخ) أثناء خلط الشخص في المواقف التي قد تواجه فيها الذراع الآلية صعوبات، نفس المعرفة التي كانت لدي التي اكتسبتها أنظمة الكمبيوتر الخاصة بالذراع الآلية أثناء إجراء التجارب على الأرض، يمكن تطبيقها في الفضاء سواء كانت مشاركة العملية مع الذراع الآلية سيتم تنفيذها بواسطة مشغل رائد فضاء أو سواء كان المشغل على الأرض.

مثال آخر على دمج هذا البحث في أنظمة ناسا هو النظام الذي يتعامل مع تنفيذ مهمة ملاحية بواسطة روبوت متنقل. الخوارزميةيمكن تطبيقه على نظام آلي تتمثل مهمته في مسح تضاريس كوكب بعيد من أجل تحديد مصادر المياه. إذا كانت مهمة الروبوت هي تعلم كيفية مسح مساحة الكوكب مع تجنب العوائق المحدودة ويواجه صعوبات أثناء أداء مهمته، فإن دمج الشخص في عملية التعلم للروبوت المتحرك على الكوكب أمر جدير بالاهتمام. نظرًا لأن الكواكب بعيدة عن الأرض ولا يُعرف تلقي المعلومات المرئية وموقع الروبوت في أي لحظة، فيجب أن يعمل الروبوت بشكل مستقل لجزء على الأقل من مهمته. عادة ما يكون عدم الاعتراف المذكور أعلاه بسبب قيود مثل إخفاء الغلاف الجوي أو سوء الأحوال الجوية. إذا لم تكن هناك مشكلة عدم اليقين خلال جزء من مدة المهمة الروبوتية، فسيكون من الممكن لمشغل الروبوت مساعدته وبالتالي تقريبه من مستوى الوكيل المستقل المثالي.

الشكل 2. روبوت متنقل يتعلم أداء مهمة ملاحية (تحت ظروف المختبر)

الشكل 2. روبوت متنقل يتعلم أداء مهمة ملاحية (تحت ظروف المختبر)

تعليقات 3

  1. فيما يتعلق بخوارزميات التعلم الآلي المطبقة على الروبوتات:

    قام ستوكاتو بتطوير تقنية تصنيف قادرة على تصنيف الإشارات (أو سلسلة البيانات) بغض النظر عن نوعها وكميتها وطولها. هذه التكنولوجيا قادرة على التغلب على أوجه القصور في أساليب التعلم الآلي الحالية، مثل القيود المفروضة على عدد الميزات.

    واستنادا إلى التكنولوجيا، قامت شركة Stoccato بتطوير العديد من محركات البحث - على سبيل المثال، محرك بحث مالي، حيث كل ما هو مطلوب من المستخدم هو تحديد اسم الضمان الأمريكي (ETF، أو صندوق الاستثمار المشترك). النتائج التي تم الحصول عليها هي الأوراق المالية الأخرى التي تصرفت بطريقة مماثلة للأمن المحدد، مع ذكر ميزة كل نتيجة (على سبيل المثال، انخفاض رسوم الإدارة، وارتفاع العائد، وانخفاض المخاطر، وما إلى ذلك). بهذه الطريقة، يتلقى المستخدم على الفور إشارة حول ما إذا كان سيستثمر في ورقة مالية بخلاف ما حدده (وبالتالي تجنب، على سبيل المثال، رسوم الإدارة غير الضرورية).

    تم تصميم محرك بحث آخر للبحث عن الأدوات المالية التي تتصرف بطريقة معاكسة (معكوس).

    تتمثل رؤية Stoccato في تضمين جميع الأدوات المالية الموجودة في محركات البحث الخاصة بها.

    http://www.stockato.com

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.