تغطية شاملة

الخوارزمية الصوتية قادرة على عزل المحادثة بين شخصين في قاعة مزدحمة

وفي المستقبل، سيكون من الممكن دمج الخوارزمية في المعدات المخصصة لضعاف السمع والسماح لهم بتركيز سمعهم على النقطة التي ينظرون إليها.

الدكتور شارون غانوت
الدكتور شارون غانوت

إحدى الطرق التي يستخدمها مخططو الهجمات أو أفراد الجريمة المنظمة بمختلف أنواعها للتواصل مع بعضهم البعض دون خوف من تنصت الشرطة، هي إجراء هذه المحادثات في غرف مكتظة بالناس، حتى لو صوت الميكروفون سيكون من الصعب جدًا فك رموز الأشياء، ويرجع ذلك أساسًا إلى الضجيج الضخم في الخلفية للمحادثات الأخرى التي يتم إجراؤها حولهم في نفس الوقت.

في المعرض العلمي الذي أقيم مؤخرا في جامعة بار إيلان، عرض الدكتور شارون غانوت من كلية الهندسة نظاما لاستخلاص المتحدثين من ليلة من المحادثات.

يوضح الدكتور جينوت: "تستخدم الخوارزمية الجديدة عددًا من الميكروفونات المنتشرة في الفضاء". "أولاً نقوم بتحديد موقع السماعات المطلوبة عن طريق مسح المساحة. تتم تصفية المعلومات التي تصل إلى مجموعة الميكروفونات باستخدام مرشح مكاني قمنا بتطويره والذي نجح في حذف السماعات غير المرغوب فيها وترك السماعات المطلوبة دون تشويه تقريبًا. ومن خلال القيام بذلك، تمكنا في الواقع من التعامل مع ظاهرة تعرف باسم "مشكلة حفل الكوكتيل"، حيث يتحدث الكثير من الناس ولكننا نريد سماع محادثة زوجين من بين كل منهم،" كما يقول غانوت. ووفقا له، فإن الخوارزمية مرنة ويمكن بعد تفعيلها الأولي تعيينها والاستماع إلى المتحدثين الآخرين في مساحة الغرفة.

يوضح الدكتور جينوت: "في الخطوة التالية، سيكون من الممكن دمج الخوارزمية في المعينات السمعية وبالتالي مساعدة ضعاف السمع عندما يكونون في بيئة صاخبة". "على سبيل المثال، سيكون من الممكن السماح لهم بالاستماع إلى المحادثة التي تجري في الاتجاه الذي ينظرون إليه. بالطبع، عندما تريد الشرطة التنصت على المشتبه بهم مثل تجار المخدرات الذين يجتمعون غالبًا في أماكن مزدحمة، سيكون من الممكن الاستماع إليهم، إذا كان من الممكن لأفرادهم زرع عدة ميكروفونات"، يضيف الدكتور جانوت. بالنسبة له، يعمل بار إيلان الآن على تحسين الخوارزمية بمساعدة الأبحاث الممولة، ومن بين أمور أخرى، الهدف هو متابعة المتحدثين الذين يتحركون في جميع أنحاء الغرفة ولا يقفون في مكان واحد. وفي هذا الإطار، يتم إنشاء مختبر صوتي فريد من نوعه في إسرائيل في كلية الهندسة، والذي سيسمح بإجراء التجارب في ظل ظروف حقيقية.

هذا التطور هو جزء من رسالة الماجستير لشموليك ماركويتز تحت إشراف الدكتور شارون غانوت والبروفيسور إسرائيل كوهين من التخنيون.

تعليقات 11

  1. الاعتماد على فروق التوقيت فقط لن يعمل عند الترددات العالية بسبب ظاهرة الغموض، لذلك سيكون من الضروري استخدام معلمات أخرى إلى جانب ITD

  2. أعتقد أن المشكلة التي تناولوها في المقالة هي حقيقة وجود المزيد من المحادثات من الميكروفونات وبالتالي لا يوجد ما يبرر حلاً واحدًا من ICA.

    والطريقة الأخرى هي استخدام نموذج صوتي للبيئة لإضافة معلومات إلى ICA وحساب ناقل الوزن لجميع الميكروفونات، ويسمى: النموذج المُعاد توجيهه

    من غير الواضح بالنسبة لي ما الجديد هنا، النموذج الصوتي؟ يتم استخدام الأساليب كما لو كان علم الأعصاب موجودًا منذ فترة طويلة: محاولة "الاستماع" إلى مجموعات من الخلايا العصبية من الدماغ بأكمله باستخدام "ميكروفونات من النوع:" EEG أو MEG

  3. و. ألا توجد هنا مخالفة للقانون الذي يمنع التنصت على محادثة ليس الشخص المنقول طرفا فيها إلا بأمر من المحكمة العليا؟
    ب. يمكنني التفكير في طريقتين محتملتين للكشف. الأول هو تحديد موقع تعديل الخطاب المعين المطلوب. وهذا بالطبع يتطلب أخذ عينة مسبقة من الشخص المقتبس. والثاني هو تحديد الموقع الدقيق في مساحة الشخص المقتبس، على سبيل المثال بواسطة شعاع الليزر ومن ثم اتجاه نظام الميكروفون للاستماع المركز من تلك النقطة، مما قد يؤدي إلى الإضرار بسرية الاقتباس.

  4. اليوبيل:
    إنه ذو صلة بالتأكيد (
    http://en.wikipedia.org/wiki/Independent_Component_Analysis
    ) ولكن من المحتمل أن الحل الذي تم تنفيذه بطريقة أو بأخرى يشير أيضًا إلى الفروق الزمنية (على الأقل بمعنى اتخاذ خطوات لتحييدها) لأنه بخلاف ذلك لن تكون هناك حاجة لضبط النظام على حالة حركة مصدر الصوت .
    علاوة على ذلك، يتحدثون بوضوح عن المرشح المكاني.

  5. وفي الحقيقة أعجبني أن الجهاز تم تطويره لحاجات علمية ولمساعدة ضعاف السمع، إلا أن المقال يتحدث عن عالم الجريمة والذكاء.

    إن التحول إلى سوق الدفاع يضاعف فرصة تحقيق التكنولوجيا، وحقيقة تلقي التمويل لمزيد من التطوير، وسوف يقومون ببناء أحد أكبر المختبرات الصوتية في البلاد.

    في بعض الأحيان تحتاج أيضًا إلى معرفة كيفية (ولمن) تسويق المنتج من أجل الاستفادة من التقنيات المتقدمة.

  6. نقطة:
    بالمناسبة، من المرجح أن تكون DTOA أحد مكونات النظام، ولكن من المحتمل أيضًا أنها ليست رؤية كالتز

  7. "من بين أمور أخرى، الهدف هو متابعة المتحدثين الذين يتحركون في جميع أنحاء الغرفة ولا يقفون في مكان واحد"

    هذه معلومة كان من الممكن إنقاذها من عالم الجريمة. الآن أصبحوا يعرفون كيفية المراوغة بسهولة.

    بحث مثير جدا للاهتمام. كل التوفيق وأتمنى أن يصل قريبًا إلى حالة تطبيقية لكل من الشرطة وضعاف السمع.

    والوضع المخيف هو أنه الآن، مع مثل هذه الخوارزمية، ستبدأ الدولة في نشر الميكروفونات في كل مكان وسيرتفع عنصر التطفل على خصوصية المواطن الهادئ والملتزم بالقانون إلى مستوى آخر. إنه أمر مخيف وغير سار أن تعرف أنه من المحتمل أن يتم الاستماع إليك. أتمنى أن يعرفوا كيفية استخدام التطوير من أجل الخير دائمًا.

    تحيات أصدقاء،
    عامي بشار

  8. نقطة:
    إنك لا تفهم الموضوع الرئيس :)
    يمكنك العثور على الموضع باستخدام فروق التوقيت فقط عندما تتعرف على نفس الصوت في عدة ميكروفونات، ولكن إذا كنت قادرًا على التعرف على "نفس الصوت"، فهذا يعني أنك قد قمت بحل المشكلة بالفعل.

  9. لا يبدو الأمر معقدًا. وباستخدام الفروق الزمنية التي يمكن قياسها بدقة كبيرة باستخدام الكمبيوتر، يمكن تحديد مصدر الصوت في الفضاء. أعتقد أن الخطوة الأولى هي نوع من معايرة النظام.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.