تغطية شاملة

يتعرف نظام الرؤية على الأشياء بفضل قدرته على تعلم وحدات التعرف الذري

وفي مقال نُشر مؤخرًا في المجلة العلمية "سجلات الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية" (PNAS)، يشير العلماء إلى اختلافات جوهرية بين آلية التعرف لدى البشر والنماذج الحالية. إن فهم هذه الاختلافات قد يساهم أيضًا في تصميم أنظمة رؤية الكمبيوتر المتقدمة.

عين. الرسم التوضيحي: شترستوك
عين. الرسم التوضيحي: شترستوك

يكفي خط منحني ونقطتان فوقه لاستحضار صورة وجه إنساني. علاوة على ذلك، فهي كافية لنا لنعرف بسهولة ما إذا كان الشخص المصور سعيدًا أم حزينًا. يسعى الباحثون في مجال الدماغ وعلماء الكمبيوتر ومهندسو الروبوتات إلى فهم كيفية عمل آلية التعرف هذه - في كل من البشر وأنظمة الكمبيوتر. اكتشف علماء من معهد وايزمان للعلوم، الذين عملوا بالتعاون مع علماء من معهد ماساتشوستس للتكنولوجيا (MIT)، أن هناك وحدة "ذرية" للتعرف - وهي الحد الأدنى من المعلومات التي يجب أن تحتويها صورة معينة حتى يتم التعرف عليها. آلية الاعتراف بالعمل. في المقالة نشرت مؤخرا في المجلة العلمية "سجلات الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية" (PNAS)، يشير العلماء إلى اختلافات جوهرية بين آلية التعرف لدى البشر والنماذج الموجودة. إن فهم هذه الاختلافات قد يساهم أيضًا في تصميم أنظمة رؤية الكمبيوتر المتقدمة.

البروفيسور شمعون أولمان وقام الدكتور دانييل هراري، بالتعاون مع الباحث لياف أسيف وطالب البحث إيتان بيتيا، من قسم علوم الكمبيوتر والرياضيات التطبيقية في معهد وايزمان للعلوم، بمقارنة آلية التعرف على النماذج الحاسوبية للرؤية الحاسوبية بقدرات العين البشرية . ولتحقيق هذه الغاية، قاموا بتجنيد آلاف المشاركين، وطلبوا منهم تحديد سلسلة من الصور. في بعض الصور، لم يكن الكائن مكشوفًا بالكامل، وتم عرض البعض الآخر بدقة منخفضة وكانت ضبابية.

كان المشاركون في الدراسة أفضل من نماذج الكمبيوتر في تحديد الصور الجزئية أو غير الواضحة، لكن جميع المشاركين فشلوا في نفس النقطة. يوضح البروفيسور أولمان: "إن فقدان كمية ضئيلة من المعلومات في هذه الصورة أو تلك أدى إلى قلب الوعاء رأسًا على عقب". "يبدو أن هناك نقطة تتوقف عندها الصورة المرئية عن إنتاج معنى للدماغ البشري، حيث تم اكتشاف انتقال حاد ومشترك لدى غالبية الأشخاص بين الصور التي يمكن التعرف عليها والصور المشابهة للغاية، والتي فشل التعرف عليها".

قد يؤدي الحد الأدنى من التغيير في كمية المعلومات المرئية في الصور إلى انخفاض كبير في قدرة الإنسان على التعرف على الصورة المرئية. أعلاه: الصور الذرية التي تسمح بتحديد الصورة؛ أدناه: صور أقل من الحد الأدنى، والتي لا تسمح بالكشف. تشير الأرقام الموجودة بجانب كل صورة إلى معدل التعرف بين جميع المواد الدراسية في الدراسة

تشير هذه النتائج إلى أنه بغض النظر عن خبرتنا الحياتية أو تدريبنا، فإن التعرف البصري يتم تشفيره بشكل جيد في الدماغ البشري، ويعمل بطريقة مماثلة بالنسبة لنا جميعًا. ويرجح العلماء أن التناقضات المكتشفة في الدراسة ترجع إلى طريقة مسح الصور في النماذج الحاسوبية، أي "من الأسفل إلى الأعلى": فهي تبدأ من العناصر البسيطة التي تظهر في الصورة، وتنتقل، تدريجيا، إلى تفاصيل أكثر تعقيدا. ومن ناحية أخرى، يستخدم الدماغ البشري عدة أساليب مختلفة في نفس الوقت، بل ويقارن مكونات الصورة بمكتبة الصور المخزنة في بنك الذاكرة الخاص به.

ويشير البحث إلى إمكانية وجود مكون أساسي في الدماغ قادر على فك صورة بصرية معقدة بناء على معلومات قليلة جدا. إن دمج مثل هذه الآلية في نماذج الكمبيوتر الحالية قد يؤدي إلى تحسين كبير في قدرتها على التعرف على الصور. إن الفهم الأفضل لهذه الآلية قد يساهم أيضًا في الدراسات المستقبلية المتعلقة بوظيفة الدماغ، وفي تطوير أنظمة الرؤية الحاسوبية، والتي ستتجاوز إلى حد كبير تلك الموجودة في حوزتنا اليوم. يمكن العثور على مزيد من التفاصيل فيموقع الأبحاث.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.