تغطية شاملة

الصورة الحقيقية

أحد أكبر التحديات التي تواجه علماء الكمبيوتر هو كيفية تعليم هذه الآلات كيفية استخراج المعلومات حول العالم ثلاثي الأبعاد من التمثيل ثنائي الأبعاد الموجود لديهم - تمامًا كما يفعل الناس؛ أي من خلال إجراءات مثل الفرز والتصنيف والمقارنة واستخدام المعرفة المستفادة.

من اليمين: نوعام إيجرمان، د. روي فوران، ود. يارون ليبمان. الحياه الحقيقيه
من اليمين: نوعام إيجرمان، د. روي فوران، ود. يارون ليبمان. الحياه الحقيقيه

يقضي الكثير منا، في العالم الحديث، الكثير من وقته في النظر إلى التمثيلات ثنائية الأبعاد للعالم ثلاثي الأبعاد: اللوحات والصور الفوتوغرافية والشاشات الإلكترونية. يعرف دماغنا كيفية ترجمة الصورة المسطحة تلقائيًا وإضفاء العمق عليها. بالإضافة إلى ذلك، يعرف الدماغ أيضًا، من بين أمور أخرى، كيفية تجميع الأشياء معًا، وملء المعلومات المفقودة، والتعرف على الأشياء المألوفة حتى عندما يتم عرضها من زوايا غير مألوفة، وقياس المسافة بين الأشياء. ومن ناحية أخرى، يتعامل الكمبيوتر العادي مع الصور على أنها مجموعة من النقاط الملونة المختلفة الموضوعة على شبكة ثنائية الأبعاد. أحد أكبر التحديات التي تواجه علماء الكمبيوتر هو كيفية تعليم هذه الآلات كيفية استخراج المعلومات حول العالم ثلاثي الأبعاد من التمثيل ثنائي الأبعاد الموجود لديهم - تمامًا كما يفعل الناس؛ أي من خلال إجراءات مثل الفرز والتصنيف والمقارنة واستخدام المعرفة المستفادة.

ومن مجالات نشاط الدكتور يارون ليبمان، الذي التحق بقسم علوم الحاسوب والرياضيات التطبيقية في المعهد عام 2011، يمكن تعريفه بـ "رياضيات التحولات". هذه هي التغييرات في الشكل التي تميز بين كائنين متشابهين، والتغيرات في الشكل التي تحدث فعليًا عندما يدور أو ينحني أو يتمدد أو يلتوي. تشمل تطبيقات أعماله مجموعة واسعة من المجالات، من علم الأحياء والهندسة إلى الرسومات والرسوم المتحركة ورؤية الكمبيوتر.

أحد الأسئلة الأساسية التي يواجهها هو: كيف يمكن تحديد ما إذا كان جسمان متماثلان أم مختلفان؟ وهذه ليست مهمة تافهة، حتى بالنسبة للبشر. بالنسبة للعين غير المدربة، ستظهر كومة من عظام الحيوانات، على سبيل المثال، كمجموعة من الأشياء المتطابقة، لكن المحترف، مثل عالم التشكل أو عالم الحفريات، سيكون قادرًا على تصنيفها إلى أنواع حيوانية مختلفة. تتطور هذه الخبرة على مدار سنوات من الممارسة، ولكن مثلما يستطيع الشخص العادي التمييز بين التفاحة والكمثرى دون أي تردد، كذلك يميز الخبير بين العظام من مصادر مختلفة دون أن يتابع بوعي كل خطوة من عملية التفكير التي تقوده. كيف إذن يمكن ترجمة عملية التفكير هذه، التي هي على الأقل جزئيًا غير واعية، إلى خوارزمية حاسوبية؟

قام الدكتور ليبمان وشركاؤه في البحث بتطوير خوارزمية تقارن وتصنف الأسطح التشريحية، مثل العظام أو الأسنان، من خلال تحليل التغيرات المحتملة في الشكل التي تحدث في النماذج ثلاثية الأبعاد التي تمثلها. الشخص الذي يقترب من مهمة المقارنة بين الأشياء سيعمل بأسلوب "من أسفل إلى أعلى": سيركز عادة على البحث عن علامات تعريف بارزة، مثل، على سبيل المثال، نتوء أو انخفاض ذو شكل يسهل التعرف عليه ، وربط جميع القرائن للوصول إلى نتيجة. يأخذ الكمبيوتر النهج المعاكس، "من الأعلى إلى الأسفل": فهو يخلق تطابقًا كاملاً بين الجسمين، ويعامل سطحهما بالكامل كوحدة هندسية واحدة، مع تقليل إجمالي مقدار التداخل في التطابق. اختبر الدكتور ليبمان هذه الخوارزمية من خلال مقارنة قدرتها على تصنيف العظام والأسنان بقدرة عالم الحفريات الخبير. في جميع الاختبارات، كانت إنجازات الكمبيوتر قريبة جدًا من إنجازات الشخص (الشكل 1). يقول الدكتور ليبمان إن الخوارزمية توفر حلاً جيدًا للعلماء الذين لم يكتسبوا الخبرة الكافية بعد، والذين يرغبون في التعرف بسرعة ودقة على أنواع الحيوانات بناءً على عينات من العظام والأسنان. ويأمل أن يكون من الممكن في المستقبل استخلاص معلومات بيولوجية أوسع من خوارزميات مماثلة.

الشكل 1: تطابق بين السطح التشريحي (السن) الذي تم صنعه بواسطة الكمبيوتر (الصور الأربع في الصف العلوي) وسطح آخر قام به عالم حفريات خبير (أدناه). يمكنك أن ترى التشابه - والفرق - بين النتيجة التي توصل إليها الكمبيوتر (الصورة اليمنى أعلاه) وتلك التي توصل إليها الخبير
الشكل 1: تطابق بين السطح التشريحي (السن) الذي تم صنعه بواسطة الكمبيوتر (الصور الأربع في الصف العلوي) وسطح آخر قام به عالم حفريات خبير (أدناه). يمكنك رؤية التشابه - والفرق - بين النتيجة التي توصل إليها الكمبيوتر (الصورة أعلاه) وتلك التي توصل إليها الخبير (الشكل 1 أ)
الشكل 1 أ - سن كما رسمه خبير.
الشكل 1 أ - سن كما رسمه خبير.

أصبح التحدي الذي يواجه علماء رؤية الكمبيوتر - كيفية تفسير المحتوى المرئي وتحليله ومقارنته تلقائيًا - أكثر إلحاحًا من أي وقت مضى. على عكس سطح الأشياء، تحتوي الصور على العديد من علامات التعريف البارزة وغيرها من الميزات التي تسهل على العقل البشري مقارنتها. ومن ناحية أخرى، أعطى الكمبيوتر أهمية متساوية لكل نقطة في الصورة. لذلك، عادةً ما يتعرف الشخص بسهولة على أن زوجًا من الصور الملتقطة بإضاءة مختلفة ومن زاوية مختلفة يظهران في الواقع نفس الكائن، لكن خوارزمية الكمبيوتر المستندة إلى نقاط المطابقة قد تجد صعوبة في القيام بذلك. الحل الذي وجده الدكتور ليبمان هو إضافة خوارزمية تكتشف التشوه، أي أنها تضع حدًا رياضيًا للطرق التي يمكن لمجموعة من النقاط أن تغير شكلها إلى مجموعة أخرى. على الرغم من أن هذا قد يكون مفاجئًا، إلا أن هذه الطريقة تمنع معظم الأخطاء في هذا المجال (الشكل 2).

الموضوع الثالث الذي يهم الدكتور ليبمان هو إنشاء نماذج لتغيرات الأشكال ثلاثية الأبعاد، والتي تصف النسخ والتشوهات بالخصائص الهندسية المطلوبة. يرتبط هذا الموضوع بمجال الرسوم المتحركة بالكمبيوتر، حيث يوجد بحث مستمر عن طرق لإنشاء حركة "حية" وأكثر واقعية على الخلفية؛ إلى مجال الهندسة، حيث النماذج الحاسوبية للأشياء تغير شكلها ويتم نسخها من مكانها؛ وكذلك في مجالات مثل التصوير الطبي وإنشاء نماذج الكمبيوتر. يعتمد النسخ على تمثيل الأشياء كشبكة من الأهرامات، وأثناء إنشاء نموذج الحركة، يقوم الكمبيوتر بفحص كيفية تحريك شبكة الأهرامات، أي كيف يتحرك كل هرم بالنسبة للآخرين. في الحياة الواقعية، تتضمن هذه الحركة العديد من المتغيرات، مثل المرونة وأنماط الحركة النموذجية للمفاصل ومناطق الالتقاء بين الأسطح المختلفة. يقوم الدكتور ليبمان بتطوير نماذج فريدة لتغيرات الحركة والشكل (الشكل 3)، والتي تمنع تكون تشوهات كبيرة أو اختراق جزء من العظم إلى جزء آخر منه (على سبيل المثال، منع اليد من اختراق الرأس عندما شخص يخدش رأسه) - اثنان من المتطلبات الرئيسية لنماذج تغيرات الشكل لتطبيقها كممثلين عن "الحياة الحقيقية".

الشكل 2: المطابقة بين صورتين. في الوسط: مجموعة من أزواج المقارنة المحتملة بين الصورتين. أدناه: نتائج الخوارزمية التي تختار ما تعتبره "أفضل أزواج النقاط المتطابقة"
الشكل 2: المطابقة بين صورتين. في الوسط: مجموعة من أزواج المقارنة المحتملة بين الصورتين. أدناه: نتائج الخوارزمية التي تختار ما تعتبره "أزواج النقاط الأكثر ملاءمة"
الشكل 3: تشوه نموذج النخيل (يسار). يؤدي استخدام خوارزمية التحويل القياسية (في الوسط) إلى تشويهات كبيرة (باللون الأحمر) وانقلابات (باللون الأصفر). يمكن لنموذج التشوه مع قيود على حجم التشوه إنشاء نسخة مماثلة بدون انقلابات ومع تشوه محظور (يمين)
الشكل 3: تشوه نموذج النخيل (يسار). يؤدي استخدام خوارزمية التحويل القياسية (في الوسط) إلى تشويهات كبيرة (باللون الأحمر) وانقلابات (باللون الأصفر). يمكن لنموذج التشوه مع قيود على حجم التشوه إنشاء نسخة مماثلة بدون انقلابات ومع تشوه محظور (يمين)

تعليقات 4

  1. زائر عالمي
    إن دماغنا مختلف تمامًا عن معالج الكمبيوتر. حتى آلان تورينج كان يعتقد ذلك، ورأى أن الدماغ يجب أن يتم تمثيله على أنه "آلة ربط" وليس كجهاز كمبيوتر تسلسلي (بالطبع لم يستخدم مصطلح "آلة تورينج"...). لدى الكمبيوتر قيود نظرية ربما لا يمتلكها الدماغ (حتى أبسط العقول). وعلى وجه الخصوص، فإن الدماغ لا يقوم بتشغيل خوارزمية.

  2. النقطة الصحيحة في الجزء الأول (الصورة التي تقع على الشبكية هي ثنائية الأبعاد....).
    لكن الخطأ في الجزء الثاني (مجرد أن الدماغ لا يقوم بكل التحليلات....).
    تشبه الشبكة العصبية للدماغ إلى حد كبير، من حيث المبدأ، معالج الكمبيوتر.
    "معقد" ليس دائمًا، بل مسألة إدراك فقط!
    وبما أن الرياضيات تهتم بوصف الأنماط، فلا يمكن القول بأن هناك ما لا يمكن وصفه رياضياً، لأنه ليس لدينا القدرة على معرفة وجود نمط لا نستطيع وصفه بأي شكل من الأشكال.
    إذا كانت هناك طريقة لوصف النمط، فمن الممكن أيضًا إعطاؤه تمثيلًا رياضيًا، لأن الرياضيات تصف الأنماط فقط، ولا تخلقها!
    على سبيل المثال، 1+1، هو وصف لموقف يحدث فيه مزيج من تمثيلين "متشابهين تمامًا" أو متطابقين، وبالتالي تكون القيمة 2.
    على الرغم من أنه، خلافًا لما يتم تدريسه في المدرسة ("كم يساوي 1+1؟")، فإن القيمة في العالم الحقيقي تأتي قبل "التمرين" (حيث لا يمكن إضافة شيء إلى آخر، دون وجود الأمرين معًا). المكان الأول).

  3. يتعرف الدماغ على معظم الأشياء في شكلها ثلاثي الأبعاد، لذلك من الأسهل عليه التعرف عليها في شكل ثنائي الأبعاد كما في الصورة، على سبيل المثال، وجهة نظر تحصل عليها أجهزة الكمبيوتر عادةً.

  4. فالصورة التي تسقط على شبكية العين تكون ثنائية الأبعاد، كما أن الدماغ يبدأ تمامًا مثل الكمبيوتر، من عالم ثنائي الأبعاد.
    إن الأمر مجرد أن الدماغ لا يقوم بكل التحليلات بواسطة الخوارزميات ولكن بواسطة شبكة عصبية شديدة التعقيد، ولا ينتمي على الإطلاق لمحاولة إعطاء وصف رياضي لما تفعله الشبكة بأكملها، يمكنك محاولة استخلاص المبادئ لكنها لا تزال غير قريبة مما تفعله الشبكة ككل.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.