تغطية شاملة

آذان الروبوت / جريجوري مون

يتيح أسلوب جديد للأجهزة الذكية فك تشفير الأصوات التي ليست أصوات الكلام البشري

رأس روبوت مع جميع أجهزة الاستشعار. الصورة: شترستوك
رأس روبوت مع جميع أجهزة الاستشعار. الصورة: شترستوك

واليوم بالفعل، تستطيع الروبوتات التعرف على الصوت البشري والاستجابة له، وذلك بفضل برامج التعرف على الصوت مثل Siri الخاص بجهاز iPhone. ومع ذلك، لا تزال الأجهزة الذكية تواجه صعوبة في التعرف على معظم الأصوات الأخرى. يقول جوزيف رومانو، خبير الروبوتات في شركة Rethink Robotics ومقرها بوسطن: "بمعنى ما، هذه ليست مشكلة معقدة بشكل خاص، ولكن لم يتم إجراء أبحاث واسعة النطاق ومتعمقة في مجال الضوضاء البيئية". "حتى الآن لم تكن [الضوضاء البيئية] ضمن نطاق قدرات ردود الفعل الآلية."

الآن، يحاول رومانو "تدريب" الروبوتات على الاستماع ليس فقط إلى المحادثات التي نجريها. قام رومانو وشركاؤه البحثيون في جامعة بنسلفانيا بتطوير أداة برمجية تسمى ROAR (اختصار لاسم البرنامج باللغة الإنجليزية: نظام التشغيل الروبوتي مفتوح المصدر للتعرف السمعي)، والذي يسمح لعلماء الروبوتات "بتعليم" الروبوتات الاستجابة لنطاق أوسع بكثير. طيف الأصوات أكثر من صوت الإنسان. كل ما هو مطلوب لتشغيل البرنامج هو ميكروفون، كما هو موضح في مقال منشور في أحد أحدث أعداد مجلة Autonomous Robots.

في المرحلة الأولى من التدريب، يلتقط الميكروفون الأصوات من البيئة ويقوم برنامج ROAR بتنظيفها من الضوضاء الثابتة. بعد ذلك، يقوم المشغل بتعليم ROAR التعرف على أصوات معينة من خلال تكرار إجراء معين، مثل إغلاق الباب أو تنشيط إنذار الهاتف الذكي، ووضع علامة على التوقيع الصوتي الفريد للصوت عندما يستمع إليه الروبوت. وأخيرًا، يقوم البرنامج بإنشاء نموذج عام لكل صوت في هذه المجموعة من القطع التدريبية.

قام فريق بحث رومانو باختبار ROAR على روبوت بذراع واحدة، مما أدى إلى تحسين قدرته على أداء مهام معينة بنجاح. وفي أحد السيناريوهات، حاول الروبوت الإمساك بمثقاب كهربائي بنفسه وتشغيله. وفي غياب ردود الفعل الصوتية، لم يتمكن الروبوت من إكمال الإجراء إلا في تسع محاولات من أصل 20 محاولة، ولكن معدل نجاحه تضاعف مع ROAR. إذا لم يسمع الروبوت طنين المحرك الكهربائي بعد الإمساك بالمثقاب، فإنه يضبط قبضته على الجهاز ويحاول تشغيله مرة أخرى.

في المستقبل، سيحاول فريق التطوير التأكد من أن النظام سيعمل أيضًا في البيئات الصاخبة. إن دمج الصوت في نطاق إمكانيات ردود الفعل الروبوتية، إلى جانب الإشارات المرئية واللمسية، يمكن أن يسمح في المستقبل للممرضات الآليات بالاستجابة بسرعة لنداءات المساعدة أو مساعدة الروبوتات الصناعية على الاستجابة في حالة حدوث خلل في سلسلة الإنتاج. ولا تزال هذه التكنولوجيا في مراحلها الأولى من التطوير، لكن رومانو يعتقد أن لديها إمكانيات هائلة. يقول رومانو: "لم نبدأ حتى في استكشاف كيفية تنفيذ ذلك".

تم نشر المقال بإذن من مجلة ساينتفيك أمريكان إسرائيل

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.