تغطية شاملة

تعليم الكمبيوتر أن يرى مثل العين البشرية

هل تتغير الصورة؟ سوف تواجه الشبكات العصبية الاصطناعية صعوبة في فك شفرتها

الذكاء الاصطناعي هو فرع من علوم الكمبيوتر يدرس القدرة على برمجة أجهزة الكمبيوتر لتتصرف مثل الدماغ البشري. في جوهره يوجد التعلم العميق (التعلم العميق) - الخوارزميات التي تسمح لأنظمة الكمبيوتر بالتعلم من الأمثلة والتجارب السابقة، وبالتالي أداء مجموعة متنوعة من المهام الحسابية.

البروفيسور يائير فايس من كلية الهندسة وعلوم الكمبيوتر في الجامعة العبرية يبحث في الذكاء الاصطناعي والتعلم العميق ورؤية الكمبيوتر (مجال يدرس كيفية تحليل أجهزة الكمبيوتر للصور لاستخراج المعلومات المرئية منها وتفسيرها). ومن المواضيع الرئيسية التي يركز عليها - والتي تجمع هذه المجالات الثلاثة - هي شبكات الخلايا العصبية الاصطناعية (الخلايا العصبية). هو نموذج رياضي حسابي (خوارزميات) تم تطويره مستوحى من الشبكات العصبية الموجودة في الدماغ البشري. تتكون الشبكات العصبية الاصطناعية من العديد من وحدات المعلومات (المدخلات والمخرجات) المرتبطة ببعضها البعض باستخدام الأرقام وتنقل البيانات من واحدة إلى أخرى، على أساس التعلم العميق. يعبر كل رقم عن قوة الاتصال بينهما، وفي النهاية الاتصال يخلق الذكاء. وبالتالي، يمكن استخدام هذه الشبكات في جميع تطبيقات الكمبيوتر تقريبًا. على سبيل المثال، تحديد الأشياء في الصور ومقاطع الفيديو، وفك رموز المحاكاة الطبية، والروبوتات، والنقل المستقل.

في العقد الماضي، تم بناء الشبكات العصبية الاصطناعية التي أدت إلى اختراقات في العديد من المجالات، بما في ذلك رؤية الكمبيوتر. ووفقا للبروفيسور فايس، فإن "التعلم العميق - الذي تعتمد عليه الشبكات العصبية - ورؤية الكمبيوتر يسيران جنبا إلى جنب. نحاول في بحثنا تعليم أجهزة الكمبيوتر الرؤية بشكل مشابه للعين البشرية. نعطيهم العديد من الأمثلة (المدخلات)، وبالتالي، باستخدام الشبكات العصبية، من المفترض أن يتعلموا الرؤية - على سبيل المثال التعرف على التفاصيل في الصور والتمييز بينها. باستخدام الأمثلة، نقوم فعليًا بتغيير الأرقام التي تربط الخلايا العصبية، حتى نحصل على النتيجة المرجوة. أي الإخراج الدقيق. على سبيل المثال، نقوم بتحميل العديد من صور الكلاب والقطط على الكمبيوتر، وهذا ينشط الخلايا العصبية التي تتعرف عليها، ومن المفترض أن تقرر ما هو الكلب وما هو القط."

"ومع ذلك،" يشير البروفيسور فايس، "لم يتم بعد تطوير هذه الشبكات بشكل كافٍ مثل الدماغ البشري. يمكنهم ارتكاب أخطاء حسابية كبيرة فقط بسبب التغييرات الصغيرة في الأمثلة. على سبيل المثال، إذا قمنا بتحريك صورة كلب بمقدار بكسل واحد، فقد يتعرف عليه الكمبيوتر على أنه حيوان مختلف، وهو ما لن يحدث بالطبع لنظام الرؤية البشري؛ سوف يقوم الإنسان بفك تشفير الصورة بدقة حتى لو تغيرت قليلاً." ما هو السؤال؟ لماذا تفشل الشبكات العصبية الاصطناعية وما الذي يجب فعله لجعلها تعمل بشكل أفضل؟

ولذلك، يركز البروفيسور فايس وفريقه على تطوير الشبكات العصبية، حتى تتمكن من التعميم بشكل أفضل وتكون أكثر دقة في التعرف. وفي دراستهم الأخيرة - والتي فازت بمنحة بحثية من مؤسسة العلوم الوطنية - أراد العلماء التحقق من سبب فشلهم وكيف يمكنهم العمل بشكل أفضل. وقاموا بدمجها في أجهزة الكمبيوتر وعرضوا لهم صورًا، على سبيل المثال للحيوانات. في البداية تعرفوا على محتوى الصور بدقة، ولكن عندما أجرى الباحثون تغييرات طفيفة عليها، على سبيل المثال نقلها بكسل إلى اليمين أو جعلها أكبر قليلاً، أصبحت الشبكات العصبية "مشوشة". على سبيل المثال، حددوا النمس على أنه قطة أو أسد البحر.

بعد ذلك، أجرى الباحثون تحليلاً رياضياً للبيانات واكتشفوا أن سبب فشل الشبكات هو نظرية أخذ العينات؛ تشرح هذه النظرية الرياضية، من بين أمور أخرى، العلاقة بين الصور وأخذ عينات البكسل فيها؛ مقدار المعلومات المطلوبة بوحدات البكسل التي تم أخذ عينات منها لإعادة بناء الصورة. ووجد الباحثون أن الشبكات لا تحقق نظرية أخذ العينات في عملية أخذ عينات البكسل، وبالتالي ترتكب أخطاء في التعرف على الصورة عندما تتغير قليلاً. واليوم يحاولون إصلاح هذا الأمر - لتعليم الشبكات كيفية تنفيذ نظرية أخذ العينات في وقت حسابي قصير.

نحن نحاول تعليم أجهزة الكمبيوتر أن ترى بشكل مشابه للعين البشرية. نعطيهم العديد من الأمثلة (الإدخال) وبالتالي، باستخدام الشبكات العصبية، من المفترض أن يتعلموا الرؤية - على سبيل المثال التعرف على التفاصيل في الصور والتمييز بينها

البروفيسور يائير فايس
البروفيسور يائير فايس. تصوير شخصي

يقول البروفيسور فايس: "لقد أدركنا أن الشبكات العصبية الاصطناعية ليست قادرة بعد على مقاومة التغيرات الصغيرة. عندما يتم إخراجهم من منطقة الراحة الخاصة بهم، فإنهم يفشلون. ولذلك، في هذه المرحلة ليس من المؤكد أنه يمكن الوثوق بهم في تطبيقات الكمبيوتر المختلفة. على سبيل المثال، إذا قامت كاميرا في مركبة ذاتية القيادة تعتمد على إحدى الشبكات التي قمنا بالتحقق منها بإجراء تغيير معقول - مثل التكبير أو التصغير - فسيؤدي ذلك إلى ارتباك السيارة. على سبيل المثال، لن يتعرف على إشارات المرور أو سيتعرف عليها فقط في وقت معين. ولذلك فإن هدفنا اليوم هو فهم كيفية تطوير الشبكات وتعزيزها بحيث تقوم بفك تشفير المعلومات المرئية بدقة تشبه العين البشرية."

الحياة نفسها:

يائير فايس هو أستاذ علوم الكمبيوتر، يعيش في القدس، متزوج ولديه أربعة أطفال (أعمارهم 10 و15 و17.5 و20 عامًا). بالإضافة إلى كونه باحثًا، فهو مستشار لشركة التكنولوجيا Mobileye وصاحب فريق كرة القدم - هبوعيل (قطمون) القدس.

المزيد عن الموضوع على موقع العلوم:

تعليقات 4

  1. هل يستطيع الذكاء الاصطناعي المحوسب الإجابة على السؤال التالي؟

    هل الدوائر الثمانية الموضحة في الرسم متشابهة مع بعضها البعض؟
    للإجابة على هذا السؤال يجب أن نتفق على أننا عندما نقول دائرة فإننا نعني خطًا دائريًا مغلقًا.
    الخط هو المفهوم الأساسي للهندسة، وله بياناتان: الطول الفعلي والشكل.
    وبما أن كل خط له شكل، فيمكننا التحدث عن التشابه والاختلاف بين الخطوط.

    نقطة
    م

    ج: هذا الخط المستقيم له طول خاص، وشكل موحد خاص.
    ب: كل خط دائري مغلق يظهر في هذا الرسم له طول خاص، وشكل موحد خاص. ج: لهذا السبب فإن هذه الخطوط الثمانية الدائرية المغلقة ليست متشابهة مع بعضها البعض.
    د: يتم التعبير عن هذا الاختلاف بظهور 7 نقاط تماس فقط مقابل 8 خطوط دائرية مغلقة.
    وهنا إجابة السؤال - هل الدوائر الـ 8 التي تظهر في هذا الرسم متشابهة مع بعضها البعض؟
    بما أن "الخط الدائري المغلق" هو ​​اسم هندسي بديل لـ "الدائرة"، فكما أن الخطوط الدائرية المغلقة لا تتشابه مع بعضها البعض، فإن الدوائر أيضًا لا تتشابه مع بعضها البعض

    ثورة عظيمة في الهندسة والرياضيات.
    منذ أيام إقليدس، رأى العلم أن الدوائر متشابهة مع بعضها البعض، وجميعها لها نفس الشكل. وعلى هذا المفهوم قدم العلم رقم شكل واحد لجميع الدوائر وهو 3.14
    لكن العلم كان مخطئًا، وفشل في التمييز بين الأشكال اللانهائية للدوائر، الناشئة عن الأشكال الموحدة الخاصة اللانهائية لخطها الدائري المغلق.
    كما أن العلم لم يكتشف العدد اللانهائي من الأشكال التي تنتمي إلى أشكال الدوائر.
    وتقع اللانهاية لهذه الأرقام الشكلية في نطاق ضيق، بين 3.1416 و3.164
    أ.اسبار 22/2/2022 اتسبار

  2. هل يستطيع الذكاء الاصطناعي للرؤية الحاسوبية الإجابة على هذا السؤال؟

    هل الدوائر الثمانية الموضحة في الرسم متشابهة مع بعضها البعض؟
    للإجابة على هذا السؤال يجب أن نتفق على أننا عندما نقول دائرة فإننا نعني خطًا دائريًا مغلقًا.
    الخط هو المفهوم الأساسي للهندسة، وله بياناتان: الطول الفعلي والشكل.
    وبما أن كل خط له شكل، فيمكننا التحدث عن التشابه والاختلاف بين الخطوط.

    نقطة
    م

    ج: هذا الخط المستقيم له طول خاص، وشكل موحد خاص.
    ب: كل خط دائري مغلق يظهر في هذا الرسم له طول خاص، وشكل موحد خاص. ج: لهذا السبب فإن هذه الخطوط الثمانية الدائرية المغلقة ليست متشابهة مع بعضها البعض.
    د: يتم التعبير عن هذا الاختلاف بظهور 7 نقاط تماس فقط مقابل 8 خطوط دائرية مغلقة.
    وهنا إجابة السؤال - هل الدوائر الـ 8 التي تظهر في هذا الرسم متشابهة مع بعضها البعض؟
    بما أن "الخط الدائري المغلق" هو ​​اسم هندسي بديل لـ "الدائرة"، فكما أن الخطوط الدائرية المغلقة لا تتشابه مع بعضها البعض، فإن الدوائر أيضًا لا تتشابه مع بعضها البعض

    ثورة عظيمة في الهندسة والرياضيات.
    منذ أيام إقليدس، رأى العلم أن الدوائر متشابهة مع بعضها البعض، وجميعها لها نفس الشكل. وعلى هذا المفهوم قدم العلم رقم شكل واحد لجميع الدوائر وهو 3.14
    لكن العلم كان مخطئًا، وفشل في التمييز بين الأشكال اللانهائية للدوائر، الناشئة عن الأشكال الموحدة الخاصة اللانهائية لخطها الدائري المغلق.
    كما أن العلم لم يكتشف العدد اللانهائي من الأشكال التي تنتمي إلى أشكال الدوائر.
    وتقع اللانهاية لهذه الأرقام الشكلية في نطاق ضيق، بين 3.1416 و3.164
    أ.اسبار 22/2/2022 اتسبار

  3. "أحد المواضيع الرئيسية التي يركز عليها - والتي تجمع بين هذه المجالات الثلاثة - هي الشبكات العصبية." غير صحيح. يمكن للشبكات العصبية الجمع بين هذه المواضيع أو مواضيع مختلفة تمامًا

    "في النهاية، الاتصال يخلق الذكاء" ماذا؟؟؟

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.