تغطية شاملة

القلق: التعرف على الوجوه وسط الحشد سيضر بالخصوصية

يمكن استخدام تقنية التعرف على الوجه لتقييد الحريات الفردية بشدة. ما الذي سيمنع الشرطة من استخدام قاعدة بيانات الصور من بطاقات الهوية ورخص القيادة؟ اخرى

إسرائيل بنيامين، مجلة "جاليليو".

في مارس 2007، نشر المعهد الوطني للمعايير والتكنولوجيا (NIST - المعهد الوطني للمعايير) بالولايات المتحدة نتائج اختبار بائع التعرف على الوجوه لعام 2006 (FVRT - اختبار بائع التعرف على الوجوه).
وتضمن الاختبار، من بين أمور أخرى، مقارنة قدرة التعرف على بعض الخوارزميات (الطرق التي يمكن تنفيذها كبرامج كمبيوتر) مع القدرة البشرية. النتائج: تمكنت ثلاث خوارزميات من التعرف على وجه أفضل من البشر الذين شاركوا في التجربة، في جميع الظروف المتضمنة في التجربة لمستويات الإضاءة ومستوى الفصل (دقة) صور الوجه.
وربما تكون هذه هي المرة الأولى التي يتم فيها إجراء اختبار مقارن بين البشر وأجهزة الكمبيوتر في هذا المجال. ومع ذلك، فإن أفضل النتائج التي حققتها أجهزة الكمبيوتر في السنوات السابقة معروفة، لذلك من الممكن أيضًا أن نستنتج أن عام 2006 كان العام الذي تمكنت فيه أجهزة الكمبيوتر حقًا من اللحاق بالأداء البشري وتجاوزه.
لتوضيح ذلك، من الضروري شرح الطريقة التي يتم من خلالها اختبار إنجازات التعرف: قامت NIST والهيئات الأخرى المشاركة في تطوير واختبار برامج التعرف على الوجه بجمع قواعد بيانات كبيرة من الصور، بحيث يوجد لكل شخص في قاعدة البيانات عدة صور في قاعدة البيانات. في أحد المستودعات، على سبيل المثال، يوجد 108,000 صورة لـ 36,000 شخص.
ولاختبار القدرة على التعرف، يُعرض على الكمبيوتر (أو الشخص المشارك في التجربة) صورتين تم اختيارهما من قاعدة البيانات. يجب على الكمبيوتر الإبلاغ عن مدى "اعتقاده" أن الصور هي صور فوتوغرافية لذلك الشخص.
وتشبه هذه التجربة الاستخدام الفعلي عند مقارنة صورة شخص مجهول بقاعدة بيانات لصور أشخاص معروفة هويتهم، على أمل العثور على تطابق الصورة الأولى مع إحدى الهويات المعروفة.
ومن المعتاد في مثل هذه الاختبارات قياس احتمال حدوث نوعين من الخطأ: النوع الأول هو "القبول الخاطئ"، ويعني الموقف الذي يقوم فيه الكمبيوتر بتحديد هوية خاطئة، والإبلاغ عن أن صورتين لنفس الشخص على الرغم من أنه ليست هذه هي القضية.
والنوع الآخر هو "الرفض الكاذب"، ويعني الحالة التي يفشل فيها الكمبيوتر في اكتشاف أن الصورتين المعروضتين له هما لنفس الشخص. في العديد من التقارير، يُطلب من برامج الكمبيوتر الوصول إلى مستوى قبول زائف يبلغ حوالي 0.001: فقط في ألف من الحالات التي أبلغ فيها الكمبيوتر عن تعريف، سيتبين في النهاية أنه كان تعريفًا زائفًا.
من السهل التحكم في معلمات البرنامج بحيث يصل الكمبيوتر إلى هذا المستوى المنخفض من الأخطاء، ولكن هذا التحكم له ثمن: عندما تقلل من فرصة حدوث أخطاء "القبول الخاطئ"، تزداد فرصة أخطاء "الرفض الخاطئ" . لو كان الكمبيوتر إنسانًا لفسرنا ذلك كما لو أن الكمبيوتر أصبح حذرًا ومترددًا، وبالتالي يخشى الخطأ إلى حد أنه يتجنب في كثير من الحالات الإبلاغ عن هوية محتملة.
بمساعدة هذه المفاهيم، من الممكن مقارنة التقدم الذي أحرزته البرمجيات في العقدين الأخيرين، عند إجراء المقارنة على أي حال لمستوى قبول خاطئ يبلغ حوالي 0.001: في عام 1993، وصلت أفضل الخوارزميات إلى نتيجة مخيبة للآمال بلغت 79. % رفض خاطئ: لم يتعرف الكمبيوتر على أربعة من "المشتبه بهم" الخمسة.

هدف طموحكان لهذه الخوارزميات قيد آخر: فهي تتطلب مساعدة بشرية. وفي كل صورة، كان هناك حاجة إلى شخص يشير داخل الصورة إلى موقع العينين. وفي عام 1997، ظهرت بالفعل خوارزميات تلقائية بالكامل، حيث وصلت نسبة الرفض الزائف إلى 54%. وفي عام 2002، تم تحقيق تحسن آخر يصل إلى 20%. في مايو 2004، أعلنت حكومة الولايات المتحدة عن "التحدي الكبير للتعرف على الوجوه" (FRGC - التحدي الكبير للتعرف على الوجوه).
تم إطلاق هذا البرنامج، الذي انتهى في مارس 2006، لتطوير تقنيات التعرف على الوجه، ووضع هدف طموح: تحسين الأداء بدرجة واحدة من حيث الحجم. لقد تم تحقيق هذا الهدف. وفي اختبار 2006 تم الحصول على نتيجة 1%:
تم بالفعل تنفيذ 99% من عمليات تحديد الهوية المطلوبة. على الرغم من أن هذه النتيجة لم يتم تحقيقها إلا في ظل أفضل الظروف، مثل الفصل العالي (الدقة) وظروف التصوير الخاضعة للتحكم، إلا أنها لا تزال تمثل تقدمًا مثيرًا للإعجاب.
بالمقارنة، بالنسبة لظروف التصوير غير الخاضعة للرقابة (مثل تلك التي تم الحصول عليها من الكاميرات الأمنية)، كانت أفضل الإنجازات التي تم الإبلاغ عنها هي الرفض الكاذب بنسبة 11٪ لأعلى دقة (ستة ملايين بكسل في الصورة، والتي منذ التقاطها في ظروف غير خاضعة للرقابة، أصبح الوجه احتلت فقط جزءًا صغيرًا منها، وكانت المسافة المتوسطة بين مركزي العينين حوالي 190 بكسلًا) و13% للدقة العالية (أربعة ملايين بكسل في الصورة، 110 بكسل بين العينين).
ومن المفترض أنه حتى في ظل هذه الظروف فإن النتائج سوف تتحسن في المستقبل القريب. ومن الجدير بالذكر أن ما يسمى في التجربة "أعلى دقة" هو بالفعل الآن الدقة المقبولة في العديد من الكاميرات الرقمية.

من يحتاج إلى التعرف على الوجه؟وفي نفس تقرير الاختبار، يتم أيضًا عرض نتائج تقنيتين أخريين لتحديد الهوية: تحديد الهوية وفقًا لصور القزحية (الجزء الملون من العين الذي يحيط بالبؤبؤ)، ووفقًا لمسح ثلاثي الأبعاد للوجه (توجد حاليًا تقنيات تجارية الأجهزة التي تسمح بمثل هذا الفحص). وقد حققت هذه التقنيات إنجازات مماثلة لتلك التي حققتها تقنية التعرف على الوجه استنادًا إلى الصور الفوتوغرافية ثنائية الأبعاد.
لماذا تستثمر حكومة الولايات المتحدة الكثير من الجهد والموارد في تقنيات تحديد الهوية؟ يمكن العثور على دليل للإجابة في الصفحة الأولى من تقرير الاختبار، في قائمة الممولين، والتي تشمل مكتب التحقيقات الفيدرالي، ومدير الاستخبارات الوطنية، ووزارة الأمن الداخلي. من السهل تخيل الاحتمالات. اليوم، تم تركيب كاميرات تغطي أجزاء كثيرة من الأماكن العامة في العالم: كاميرات أمنية تابعة للحكومة والشرطة، وكاميرات لمنع السرقة وكاميرات تديرها المنظمات السياحية والأفراد.
إذا قام مجتمع الاستخبارات الأمريكي بتخزين صور لإرهابيين مشتبه بهم، فسيكون قادراً، بمساعدة هذه التكنولوجيا، على مسح الصور من هذه المصادر العديدة، وتلقي تنبيهات موثوقة عندما يظهر هؤلاء المشتبه بهم في أي مكان في العالم. كم عدد الهجمات التي يمكن منعها بهذه الطريقة؟

كم عدد الضحايا الذين يمكن إنقاذهم؟ومن السهل أن نفكر في استخدامات أخرى: فقد رأينا بالفعل مدى القلق الذي شعر به السكان عندما هرب سجين خطير، بسبب الخوف من ارتكابه المزيد من أعمال العنف. عندما يتم تغطية كل مكان يمر به السجين بالكاميرات، ويتم فحص الصور الملتقطة هناك، فإن طريق عودته إلى السجن سيكون أسرع. يمكن للوالدين الذين فقد طفلهم أيضًا استخدام القدرة الدؤوبة لأجهزة الكمبيوتر لمسح الصورة تلو الأخرى، وكاميرا بعد كاميرا، حتى يتم العثور على الطفل المفقود.
لا يمكنك التحقق من الصور التي تم التقاطها في هذه اللحظة فحسب، بل يمكنك أيضًا التحقق من الصور التي تم التقاطها في وقت ما في الماضي: يتم توصيل المزيد والمزيد من الكاميرات بالإنترنت، لذلك يمكن لأصحاب الكاميرات أن يقرروا ما إذا كانوا سيمنحون حق الوصول لأي شخص يريد ذلك أو فقط لأولئك المصرح لهم بذلك.
بمجرد تحقيق الوصول (قانونيًا أو غير ذلك)، يمكن تسجيل أي صورة يتم استلامها من جميع كاميرات الفيديو التي يمكن الوصول إليها. وحتى لو كان الطفل المفقود غير مرئي حاليًا على أي كاميرا، فيمكنك البحث عنه في صور من الماضي، وبالتالي محاولة فك رموز ما حدث له وأين اختفى.
مثال آخر: إذا كانت الشرطة تحاول ربط مشتبه به بجريمة ارتكبت في مكان معين، فيمكنها مسح الكاميرات الموجودة في تلك المنطقة بالقرب من وقت ارتكاب الجريمة، على أمل العثور على المشتبه به. يمكنها أيضًا محاولة مطابقة التسجيلات مع قاعدة بيانات الصور الإجرامية الموجودة لديها.
قد يشعر بعض القراء بقشعريرة في هذه المرحلة: فمن الممكن استخدام نفس التكنولوجيا لتقييد الحريات الفردية بشدة. ما الذي سيمنع الشرطة من استخدام قاعدة بيانات الصور من بطاقات الهوية ورخص القيادة؟
هل يجوز لصاحب العمل أن يبحث عن وجه موظفيه بين المشاركين في المظاهرة الذين لا يتفقون مع أهدافها؟ هل يمكنه التحقق من مكان تواجد الموظف الذي أبلغ عن مرضه؟ وتقول وزيرة التربية والتعليم يولي تمير إنها عندما كانت في المدرسة الثانوية، تجنبت المدرسة للمشاركة في المسيرة، لكن للأسف تعرف عليها مدير المدرسة في صورة نشرتها إحدى الصحف بجانب مقال عن تلك المسيرة.
هل سيتلقى مدراء مدارس الغد على مكاتبهم كل صباح تقريرا عن المواقع الترفيهية التي تمت مراقبة طلابهم فيها؟ هل يجب على الآباء الاهتمام بمراقبة تصرفات أبنائهم المراهقين؟ (ويجب أن نتذكر أنه ليس أقل احتمالا أن يجد هؤلاء الأولاد والبنات، الذين هم أول من تبنوا الابتكارات التكنولوجية، الطريق لمتابعة أصدقائهم وأولياء أمورهم ومعلميهم).

التعرف على الوجوه سوف يساعد النسيان على تذكر الأسماءإذا لم تكن صورة هذا الشخص موجودة في قاعدة البيانات الخاصة بي، فسيلجأ الكمبيوتر إلى الإنترنت، من خلال اتصال لاسلكي، ويتحقق مما إذا كان الوجه الغامض يظهر في مكان ما بجوار اسم الشخص. هذا لم ينجح أيضا؟ أنا مجبر على السؤال من هو ذلك الشخص الذي أعرفه القديم، ثم يقول: "لطيف جدًا يا آرون"

الأخ الصغير يراقبك
ليست الحكومات فقط هي المهتمة بالتعرف على الوجه. إحدى الشركات التي حققت نتائج عالية في اختبار FVRT هي شركة Neven Vision. في أغسطس 2006، استحوذت شركة إنترنت معروفة لنا جميعًا - Google - على شركة Nevan.
تفسير جوجل لعملية الشراء هذه: تخطط جوجل لتزويد بيكاسا، برنامجها الشخصي لإدارة ألبومات الصور، بالقدرة على تصنيف الصور حسب الموضوع (الأشخاص أو المناظر الطبيعية، على سبيل المثال)، وفي المستقبل أيضًا تحديد الأشخاص والأماكن التي تظهر فيها . من منا لا يريد البحث في أرشيفاته عن جميع الصور الملتقطة في مكان معين، أو كل الصور التي تظهر فيها ابنة الأخ اللطيفة؟
يعد الاستحواذ على Google مجرد مثال واحد: الشركات الأخرى التي حققت أشياء عظيمة هي Samsung وToshiba، اللتين بالتأكيد لديهما أيضًا أفكار حول كيفية تحسين (؟) حياتنا بمساعدة التعرف على الوجه. أحد الخيارات، والذي تم تقديمه بالفعل في العديد من المختبرات حول العالم: لتجنب الموقف المحرج حيث لا أتذكر من هو الشخص الذي اتصل باسمي للتو، سأرتدي كاميرا مصغرة على نظارتي. سيتم توصيل الكاميرا بالكمبيوتر الذي أدخلت فيه الصور والأسماء، وستهمس لي سماعة صغيرة مخبأة في ساق النظارة بالاسم الذي نسيته.
إذا لم تكن صورة هذا الشخص موجودة في قاعدة البيانات الخاصة بي، فسيلجأ الكمبيوتر إلى الإنترنت، من خلال اتصال لاسلكي، ويتحقق مما إذا كان الوجه الغامض يظهر في مكان ما بجوار اسم الشخص. هذا لم ينجح أيضا؟ أنا مجبر على السؤال من هو ذلك الشخص الذي أعرفه القديم، ثم أقول: "لطيف جدًا يا آرون".
سيتعرف الكمبيوتر على هذا البيان كرمز يتطلب منه حفظ صورة أهارون بجوار اسم "أهارون"، وفي المرة القادمة سيتأكد أهارون من أنني أتذكره (سيكون الكمبيوتر أيضًا قادرًا على تذكيري أين كنت عندما لقد تحدثت مع أهارون آخر مرة، ولعب لي جزءا من حديثنا في تلك المناسبة، ولكن هذا موضوع لمقال آخر).
وهنا أيضًا يمتد أمامنا منحدر زلق. يقوم المزيد والمزيد من الأشخاص بتحميل أرشيفات الصور الخاصة بهم على الإنترنت. إذا كانت هناك صورتي بجوار اسمي في مكان ما، فهذا يكفي للبحث عن وجهي في أي صورة أخرى تظهر في أي موقع على الإنترنت. سيكون من الممكن أيضًا البحث عني في تسجيلات عمليات البث الخاصة بأي كاميرا ويب (Web Cam) يمكن لعامة الناس الوصول إلى صورها.
اليوم، يتم التعرف على المشاهير فقط أينما ذهبوا. هل سيكون كل واحد منا موضوع بحث في المستقبل؟ عندما يستعد أحدنا لاجتماع عمل أو اجتماعي مهم، هل سيتمكن من العثور على الإنترنت ليس فقط على المكان الذي ظهر فيه اسم الشخص الذي التقى به، ولكن أيضًا على مكان وجوده في الأيام القليلة الماضية (أو حتى خمس سنوات) سابقًا)، حيث يتسكع عادةً، والمتاجر التي يذهب إليها، وما إلى ذلك.'؟
ماذا سيفعل المجرمون بمساعدة هذه التكنولوجيا؟ سيكونون قادرين على معرفة متى تكون بعيدًا وبالتالي يمكن اقتحام منزلك، وسيكونون قادرين على المضايقة والترهيب، وسيبحثون عن فرص للابتزاز، وسيفكرون بالتأكيد في المزيد من الأفكار الإبداعية.
إن هذه السيناريوهات المثيرة للقلق ليست ممكنة بعد، ولكن بمعدل التقدم الحالي، لا يوجد سبب يمنعنا من رؤية هذه السيناريوهات تؤتي ثمارها حتى قبل نهاية هذا العقد.

التكنولوجيا تعطي والتكنولوجيا تأخذ
يعرف رالف جروس، من معهد الروبوتات بجامعة كارنيجي ميلون، كلا الجانبين من القضية جيدًا. ومن بين أمور أخرى، ساعد وكالات الترخيص في الولايات المتحدة في البحث عن الأشخاص الذين تم إلغاء رخصة قيادتهم في إحدى الولايات، ثم تقدموا بطلب للحصول على رخصة جديدة في ولاية أخرى، أو تحت اسم مختلف في تلك الولاية. اتضح أنه من خلال مقارنة صور أشخاص مختلفين، يبدو أنه تم القبض على العديد من هؤلاء المجرمين، ومن الممكن تجنب العديد من الحوادث المميتة.
ومن ناحية أخرى، يعمل جروس مع مختبر خصوصية البيانات التابع لجامعة كارنيجي ميلون لإيجاد طرق لوقف هذا الانزلاق. يعتمد النهج الذي يقترحونه على حقيقة مثيرة للاهتمام: على الرغم من أن البشر وأجهزة الكمبيوتر لديهم قدرة عالية في التعرف على الوجه، إلا أنهم يؤدون نفس المهمة بطرق مختلفة تمامًا.

سر الطريقة البشرية

في الواقع، لا نستطيع أن نقول الكثير عن الطريقة البشرية أو الطريقة المحوسبة: بالنسبة للإنسان، على الرغم من النتائج العديدة حول الأماكن في الدماغ التي يتم فيها التعرف، وعن أسباب الحالات المرضية التي تفقد فيها القدرة على التعرف على الوجوه ( Prosopagnosia - من اليونانية؛ prosophon تعني "الوجه" وagnosia تعني "الجهل")، ما زلنا لا نعرف كيف نصف مبادئ الطريقة التي يعمل بها العقل (انظر: يفعات ليفي ورافائيل ملاخ - "من الصغير إلى الصغير" كبيرة في الدماغ البشري"، "جاليليو" 49).
على الجانب التكنولوجي، على الرغم من نشر بعض خوارزميات التعرف على الوجه الفعالة في الماضي، إلا أن الشركات التي حققت التقدم المذهل الذي تم الإبلاغ عنه في FRVT لا تكشف عن الطرق التي وصلت بها إلى هذه التحسينات.
حتى لو لم نتمكن من فحص الطرق المختلفة للشخص والكمبيوتر، يمكننا أن نرى أن هناك اختلافات في نتيجة الاختبار: فالناس أفضل في التعرف على الوجوه التي يعرفونها جيدًا (بمعنى أننا رأيناهم بالفعل بأشكال مختلفة، وفي إضاءة مختلفة). الخ)، وفي التعرف على الوجوه التي يتم النظر إليها من زوايا غير تقليدية (من الجانب أو من الأسفل، على سبيل المثال). أجهزة الكمبيوتر أفضل في التعرف على الوجوه التي تتم رؤيتها مرة واحدة فقط وعندما تكون كلتا العينين مرئية بوضوح.
إن الأساليب التي تجعل من الصعب على البشر التعرف على الوجوه لا تجعل من الصعب بالضرورة على أجهزة الكمبيوتر: فقد وجد جروس وزملاؤه أن المربعات التي تخفي وجوه الشخصيات على شاشات التلفزيون وفي الصحافة لا تزال في كثير من الأحيان تسمح للبرنامج باكتشاف هوية الشخصيات. الشخص الذي تمت مقابلته - حتى عند مستويات التمويه العالية للغاية (الحجم المربع). في بعض الأحيان تعمل هذه المربعات على تحسين قدرة الكمبيوتر على التعرف، لأنها تزيل التفاصيل التي تميل إلى "إرباك" البرنامج! (في نهاية المقال يوجد رابط لمقال حول هذا الأمر، والطريقة الموضحة أدناه).
إذا كان الأمر كذلك، فهل من الممكن العثور على عملية عكسية - عملية من شأنها أن تمنع الكمبيوتر من التعرف على الوجه، ولكن لا تضر بسهولة استخدام الصورة للبشر؟ ويبدو أن مثل هذه الطريقة موجودة.
قام الباحثون في مختبر خصوصية المعلومات، بقيادة ليتانيا سويني، بتطوير عملية يتم فيها دمج تفاصيل الوجه لعدة أشخاص مختلفين لإنشاء صورة جديدة، ويتم تركيب هذه الصورة فوق الصورة الفوتوغرافية أو الفيديو الأصلي (الرابط في نهاية المقال).
والغرض منها هو التعامل مع المواقف التي تعتقد فيها الشرطة، على سبيل المثال، أن بعض أفلام المراقبة قد تحتوي على معلومات تتعلق بالتحقيق في جريمة ما، ولكن ليس لديها حجج مقنعة بما فيه الكفاية للقاضي للموافقة على الوصول إلى تلك الأفلام. لا يمكن تقديم الحجج إلا بعد أن تشاهد الشرطة الأفلام فعليًا - وهو موقف "الصيد 22".
يقترح فريق سويني طريقة لإخفاء الهوية: يمكن للشرطة مشاهدة نسخة من الفيلم تم فيها استبدال جميع الوجوه بـ "الوجوه المركبة"، بحيث يتكون كل منها بطريقة مختلفة من عدة شخصيات مختلفة. في هذا الفيلم يمكنك حتى رؤية تعابير الوجه وفهم الأحداث، لكن لا يمكن التعرف على المشاركين إلا بعد تلقي أمر القاضي.
أثناء التطوير، أصبح من الواضح أنه يمكن أيضًا استخدام طريقة مماثلة لإنشاء صور يتعرف عليها الأشخاص بشكل أفضل من الكمبيوتر (على الرغم من أن التعرف سيظل غير مؤكد) - جرب العرض التوضيحي (الرابط في نهاية المقالة) لترى كم مرة كان تخمينك أكثر نجاحًا من البرامج المنافسة بداخلك.
هذه الدراسة هي جزء من مجال بحثي واسع ومهم يبحث في وجهين لنفس السؤال: من ناحية، تظهر الدراسة قدرة البرمجيات على اختراق حجاب عدم الكشف عن هويته والخصوصية - وهو نفس الحجاب الذي نخدع أنفسنا به إذا كنا نعتقد أنه موجود وسيظل موجودا في المستقبل. ومن ناحية أخرى، فهو يطور أدوات لإخفاء الهوية مع إلحاق أقل قدر ممكن من الضرر بإمكانية استخدام تلك التكنولوجيا التي تساعدنا وتحمينا أثناء تجوالنا على الشبكة، أو في العمليات الطبية، أو حتى عندما نسير في الشارع. ويلعب الذكاء الاصطناعي دورًا مهمًا في كلا الجانبين.

يعمل Israel Binyamini في ClickSoftware لتطوير أساليب التحسين المتقدمة.
من عدد أغسطس من مجلة "جاليليو".

تعليقات 4

  1. والحكومة ليست جزءاً من المعضلة، لأنه حتى لو كان بوسعنا أن نثق في السلطات، فمن يستطيع أن يضمن لنا أن الخزان الضخم لن يقع في أيدي غير ودية بشكل واضح؟

  2. هذه المعضلة الصعبة، هل يمكننا أن نثق في الحكومة (أنفسنا) ألا تستخدم هذا لغرض شرير، ما هو الغرض الشرير؟ أنا أتفق مع التنصت الأمريكي وأراه مثل فحص رسائل البريد الإلكتروني الخاصة بـ Google ...

    أعتقد أنه في مرحلة ما سيتعين علينا كتابة دستور أخلاقي، لأن الأخلاق مرنة للغاية بحيث لا يمكنها تحديد التطورات المستقبلية...

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.