تغطية شاملة

انظر كما ولد

رائد الرؤية الحاسوبية يحاول تقليد العقل البشري - مقابلة مع البروفيسور شمعون أولمان الحائز على جائزة إسرائيل

أدلة مصطنعة. الرسم التوضيحي: شترستوك
أدلة مصطنعة. الرسم التوضيحي: شترستوك

نحن جميعًا محاطون بآلاف أجهزة الكمبيوتر والكاميرات كل يوم. لكن ما يتيح للإنسان من الكمبيوتر، حتى الآن، هو قدرتنا على فهم ما نراه، بينما يحتاج الكمبيوتر إلى وسيط. سيتمكن الشخص الذي يراقب وجوه الآخرين من التعرف بسهولة على تعبيرات الوجه مثل الحزن أو الفرح أو الغضب أو القلق. يستطيع الكمبيوتر مسح العديد من الوجوه بسرعة كبيرة، لكنه لن يكون قادرًا على التعرف على التعبيرات دون قدر كبير من التدريب المسبق، وحتى في هذه الحالة سيقتصر على مجموعة محددة جدًا. هل من الممكن إعطاء أجهزة الكمبيوتر القدرة على فك تشفير الصور التي يتمتع بها البشر؟ يقول البروفيسور شمعون أولمان من معهد وايزمان للعلوم، والذي سيحصل على الجائزة: "في بعض المجالات الصعبة للغاية، لم تعد أجهزة الكمبيوتر بعيدة عن القدرة البشرية، مثل القدرة على التعرف على أشياء معينة في صورة ما، أو التعرف على الوجوه". جائزة إسرائيل في الرياضيات وعلوم الكمبيوتر هذا العام لمساهمته في مجال رؤية الكمبيوتر. "نحن ننظر إلى العالم ونتلقى على الفور، في جزء من الثانية، معلومات غنية ومتنوعة للغاية: ربما نرى أشخاصًا يلعبون الشطرنج أو أطفالًا يلعبون الكرة أو سيارة تعبر تقاطعًا. كل ما ننظر إليه، فمن الواضح لنا على الفور ما هو هناك: إذا كان هناك أشخاص هناك، فمن يفعل ماذا لمن، وما إلى ذلك. في الوقت الحالي ليس لدينا القدرة على القيام بمثل هذه الأشياء على الكمبيوتر. لكننا نحرز تقدما نحو مثل هذه القدرات."

الأجنحة والدماغ
كان أولمان طياراً مقاتلاً في سلاح الجو، واتجه إلى دراسة الرياضيات والفيزياء، واكتشف خلالها دراسة الدماغ، كما أضاف علم الأحياء إلى برنامج دراسته في الجامعة العبرية. وعندما أنهى دراسته الأولى بمرتبة الشرف، تقدم بطلب للحصول على الدكتوراه المباشرة في مجال الذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا (MIT). وبقي هناك أيضًا كباحث، ولكن في الثمانينيات عاد إلى إسرائيل، وانضم إلى معهد وايزمان، وجلب مجال رؤية الكمبيوتر إلى إسرائيل. ويوضح قائلاً: "في النظام البشري، تنقل العيون الصورة إلى الدماغ ويقوم الدماغ بالعمل، ويفهم ما هو موجود في الصورة". "نود أن نفعل الشيء نفسه بطريقة محوسبة، مع جهاز كمبيوتر ونظام كاميرا. تصل الصورة إلى الكمبيوتر، ويلعب دور الدماغ. نود أن نعرف أي نوع من الحسابات ينبغي تقديمه له، وما هي الخوارزميات وما هي القدرات الحسابية، حتى يتمكن من رؤية وفهم العالم من حوله من الصور التي تصل إليه عبر الكاميرا.

التقاط الجوهر
تمكن أولمان في أعماله المبكرة من أن يكون أول من طور نظام حاسوبي يعرف كيفية اكتشاف العمق في صورة ثنائية الأبعاد، كما طور أنظمة كشف الحركة. انتقل لاحقًا إلى تطوير أنظمة "أعلى" مصممة للتمييز بين الأشياء المختلفة. على سبيل المثال، الكلب والقط مخلوقات متشابهة تمامًا، لديهم أربعة أرجل ورأس وذيل وما إلى ذلك. يمكن لأي شخص، حتى لو كان طفلًا صغيرًا، التعرف بسهولة على ما إذا كان يرى كلبًا أو قطة، ولكن من الصعب جدًا على الكمبيوتر التقاط "كلاب" و"قطط"، ويحتاج البرنامج إلى عرض موجه لآلاف الصور، حتى يتمكن من ذلك للوصول إلى مستوى معقول من التشخيص. ويستمر الباحثون في مواجهة مثل هذه التحديات طوال الوقت. أحد المشاريع التي يقودها أولمان حاليًا هو "الطفل الرقمي" - وهي محاولة لتطوير نظام كمبيوتر يمكنه تقليد ما يحدث في دماغ الطفل، والذي يتلقى ويعالج كمية هائلة من المعلومات المرئية في السنة الأولى من عمره. حياته، ويجمع صورة للعالم لنفسه. "عندما يفتح الطفل عينيه، يبدأ في تلقي ثروة من المعلومات من خلالها، وبطريقة ما تتدفق في رأسه ويبدأ في فهم العالم دون توجيه منظم من الأشخاص المحيطين به، لأنه لا يفهم اللغة بعد "، يقول أولمان. "نود أن نفهم هذه العمليات ونبين أنه يمكن إنشاؤها في الآلة. نظام كمبيوتر لم يشاهد صورة واحدة، ويبدأ تدفق الصور ومقاطع الفيديو إليه لأسابيع وأشهر. ونتيجة لذلك، فإنها ستخلق صورة للعالم لنفسها: الأشخاص، والأشياء، والروابط بينهم وما إلى ذلك."

البروفيسور شمعون أولمان، الحائز على جائزة إسرائيل في الرياضيات وعلوم الكمبيوتر، يتناول القدرة البشرية في عدة مجالات. الصورة: العلاقات العامة
البروفيسور شمعون أولمان، الحائز على جائزة إسرائيل في الرياضيات وعلوم الكمبيوتر، يتناول القدرة البشرية في عدة مجالات. الصورة: العلاقات العامة

 

إجابات بعيدة
ولا يزال الطريق إلى تطوير مثل هذه القدرات في أجهزة الكمبيوتر طويلا، ويتطلب فهما أفضل للعمليات التي تحدث في الدماغ البشري. "في البشر، كل التعلم، على الأقل في المراحل الأولى، يتم بطريقة غير موجهة للغاية. إنه ببساطة معرض للمعلومات، وهو قادر على استيعاب المعلومات المهمة من ثروة المعلومات". "هناك أشياء تختلف اختلافًا جوهريًا عن كل ما نفهمه حاليًا. ولهذا السبب يبدو هذا النوع من التوجه البحثي مثيرًا للاهتمام، ولكنه يتعامل مع أسئلة ما زلنا بعيدين جدًا عن العثور على إجابات لها."

مجال متطور
بالإضافة إلى عمله الأكاديمي، يعد أولمان أحد القوى الدافعة وراء صناعة الرؤية الحاسوبية في إسرائيل. وكان أحد مؤسسي شركة "أوربوتيك" التي تعمل في مجال المسح البصري لمكونات صناعة الإلكترونيات، بناءً على براءات اختراع طورها هو وزملاؤه. لأكثر من 20 عامًا، كان أولمان كبير العلماء في الشركة، وعمل أيضًا في منصب مماثل في القسم الإسرائيلي للمواد التطبيقية. يحتوي مجال الرؤية الحاسوبية على مجموعة كبيرة ومتنوعة من التطبيقات المحتملة: بدءًا من الاستخدامات الأمنية، مثل البحث عن الإرهابيين في الحشود بمساعدة أنظمة التعرف على الوجه، مرورًا بالتطبيقات الطبية، والتطورات في مجال التجارة والصناعة، ومساعدة المكفوفين. وتطوير المركبات ذاتية القيادة، وأكثر من ذلك. يقول أولمان: "هذا مجال يُتوقع له العظمة، وهو يتطور بسرعة في جميع أنحاء العالم، ومن دواعي سرورنا أنه يتطور بسرعة خاصة هنا في إسرائيل". "إن صناعة الرؤية الحاسوبية في إسرائيل تصدر بالفعل مئات الملايين من الدولارات سنويا وتوظف آلاف العمال، ومن المتوقع أن تستمر في التوسع."

سننتظر ونرى
كان أولمان رائد الرؤية الحاسوبية في إسرائيل، واليوم تتبع خطواته العديد من المختبرات في هذا المجال - في الأوساط الأكاديمية والصناعة. والسؤال اليوم ليس ما إذا كان الكمبيوتر سيكون قادرا على تقليد عمليات الرؤية في الدماغ البشري، ولكن متى سيحدث ذلك، وما إذا كانت هذه القدرات ستستخدم لصالح البشرية أو ضدها. سننتظر ونرى... أي سننتظر وسيرى الكمبيوتر.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.