تغطية شاملة

بنيت للاتصال

زوجان من الولايات المتحدة الأمريكية يعملان باحثين في معهد فيتزين: ياكير رشيف وهيلاري بينوكين وقعا بشكل مشترك على مقال نشر مؤخرا في مجلة ساينس، والذي يتناول العلاقات

ياكير رشيف وهيلاري فينوكين. الحصول على أكثر إحكاما الصورة: معهد وايزمان
ياكير رشيف وهيلاري فينوكين. الحصول على أكثر إحكاما الصورة: معهد وايزمان

 

تعتبر الاتصالات أمرًا معقدًا، ولكن لحسن الحظ بالنسبة لياكير رشيف، يبدو أن اكتشاف اتصالات مهمة هو في الواقع نقطة قوته. ياكير، الذي ولد في إسرائيل عام 1987 ونشأ في الولايات المتحدة الأمريكية، التقى بهيلاري فينوكين في المدرسة الإعدادية، ومنذ ذلك الحين توطدت العلاقة بينهما: فكلاهما درس في قسم الرياضيات في جامعة هارفارد، وكلاهما حاليا في جامعة هارفارد. كلية الرياضيات وعلوم الكمبيوتر في معهد وايزمان للعلوم. ياكير هو باحث مدعوم بمنحة فولبرايت، كطالب ضيف في مجموعة البروفيسور موني ناعور، وهيلاري تدرس للحصول على درجة الدكتوراه في مجموعة البروفيسور إيتاي بنياميني.

في ظل كل هذا، لا ينبغي أن يكون مفاجئاً أن يوقع الزوجان بشكل مشترك على مقال نشر مؤخراً في مجلة ساينس، يتناول العلاقات. لكن ما قد يثير الدهشة هو أن شريكًا آخر في المقال هو شقيق ياكير، الدكتور ديفيد راشيف، العالم في مجال علوم الكمبيوتر في معهد برود بجوار معهد ماساتشوستس للتكنولوجيا وجامعة هارفارد (معهد برود التابع لمعهد ماساتشوستس للتكنولوجيا). وهارفارد). تقدم المقالة طريقة جديدة لمعالجة المعلومات، وهي قادرة على مسح مجموعات معقدة من البيانات، وتحديد العلاقات والاتجاهات المثيرة للاهتمام - والتي لا يمكن تحديدها بوسائل أخرى للتحليل الإحصائي.

"عندما كنت طالبًا في جامعة هارفارد، طلب مني أخي مساعدته في إنشاء برنامج كمبيوتر يمكنه تصور وتحليل مجموعات كبيرة من البيانات في مجال الصحة العامة. عندما بدأنا العمل، اكتشفنا أنه من أجل القيام بذلك، يجب عليك أولاً تحديد الاتصالات التي يجب أخذها بعين الاعتبار"، يوضح ياكير. هذا الشرط، الذي قد يبدو بسيطًا، يصبح أكثر تعقيدًا مع نمو مجموعات البيانات. وهكذا، على سبيل المثال، يواجه علماء الأحياء المجهرية المهتمون بتحليل العلاقات بين المجموعات البكتيرية الموجودة في أمعاء البشر والثدييات الأخرى تريليونات من البكتيريا. حتى لو قمنا بتقليل مجموعة البيانات لتحتوي على 7,000 بكتيريا فقط، فإننا لا نزال نحصل على أكثر من 22 مليون اتصال محتمل بين أزواج البكتيريا. إنه محيط شاسع من المعلومات، طالما أننا لا نعرف ما هي أنواع الأنماط التي يجب البحث عنها. أصبحت التحديات من هذا النوع، والتي تشمل مجموعات البيانات التي تعتمد على آلاف المتغيرات، أكثر شيوعًا في مجالات مختلفة مثل علم الجينوم والفيزياء والعلوم السياسية والاقتصاد وغيرها، ويتزايد الطلب على الأدوات الفعالة لمعالجة المعلومات. .

أدرك العلماء أنهم بحاجة إلى خوارزمية يمكنها اكتشاف اتصالات جديدة ومهمة، ولكن أيضًا روابط غير متوقعة - تلك التي ربما تكون قد غابت عن العين. الطريقة التي طوروها - بتوجيه من البروفيسور مايكل ميتزنماخر من كلية الهندسة والعلوم التطبيقية بجامعة هارفارد، والبروفيسور بارديس ساباتي من معهد برود - تسمى "معامل المعلومات الأقصى" (MIC). وهو يعتمد على فكرة أنه إذا كانت هناك علاقة بين متغيرين، فمن الممكن تحديد أشرطة القيمة لكل منهما - والتي ستؤدي معًا إلى إنشاء شبكة مشتركة - والتي ستسلط الضوء على العلاقة. وتقوم الخوارزمية التي تحسب الحد الأقصى لمعامل المعلومات بمسح العديد من الشبكات التي يمكن إنشاؤها بهذه الطريقة، واختيار الأفضل من بينها، وتحديد قوة الاتصال بناءً عليها. من الممكن حساب الحد الأقصى لمعامل المعلومات لكل زوج من المتغيرات في مجموعة البيانات، وترتيب الأزواج وفقًا للدرجة التي حصلت عليها (كلما زادت الدرجة، كانت العلاقة أقوى)، ثم فحص الأزواج التي حصلت على أعلى الدرجات - أي أن المتغيرات ذات التأثير الأقوى على بعضها البعض.

ولاختبار الطريقة الجديدة، طبقها العلماء على عدد من مجموعات البيانات، في مجالات مثل الصحة العامة، والتعبير الجيني، ومجموعات البكتيريا المعوية، ودوريات البيسبول، وقارنوا نتائج الخوارزمية الجديدة بالنتائج التي تم الحصول عليها بواسطة طرق أخرى. .

وفي تحليل بيانات بكتيريا الأمعاء، تمكنت الخوارزمية من اختزال 22 مليون زوج من المتغيرات إلى عدة مئات من العلاقات المثيرة للاهتمام، والتي لم يتم اكتشاف الكثير منها باستخدام طرق أخرى. وهكذا، على سبيل المثال، تم اكتشاف حالات "العدم في نفس الوقت"، أي عندما يكون نوع واحد من البكتيريا شائعا جدا، يكون هناك نوع آخر غير شائع. وبعض حالات "العدم في نفس الوقت" تلك هي حالات معروفة، ومن المعروف أنها ناجمة عن الطعام الذي يتناوله الحيوان الذي تسكن فيه البكتيريا، بينما كانت حالات أخرى فريدة، وألمحت إلى احتمال إلى أن هناك عاملاً آخر غير نوع الطعام يؤثر على هذه الحالة.

رسم بياني يوضح العلاقة بين الأنواع الفرعية المختلفة للبكتيريا المعوية
رسم بياني يوضح العلاقة بين الأنواع الفرعية المختلفة للبكتيريا المعوية. تمثل العقد الأنواع الفرعية، وتمثل الحواف التي تربطها العلاقات غير الخطية الرئيسية البالغ عددها 300 علاقة. حجم العقدة يتناسب مع عدد اتصالاتها. تمثل الأشرطة السوداء العلاقات التي يفسرها تناول الطعام. العقد محاطة بلون حسب نسبة الأضلاع السوداء من بين جميع الأضلاع المجاورة لها (0% باللون الأزرق، 100% باللون الأحمر)

وفي مثال آخر، قام فريق العلماء بفحص قاعدة بيانات منظمة الصحة العالمية، والتي تتضمن 357 متغيرًا في 200 دولة. إحدى الروابط المثيرة للاهتمام، والتي وجدت في جزر المحيط الهادئ، كانت العلاقة المباشرة بين السمنة بين النساء ومستوى دخل الأسرة - على النقيض من ما يحدث في بلدان أخرى، حيث تزيد السمنة أولا ثم تنخفض. أحد التفسيرات المحتملة لهذه النتائج غير العادية هو أن السمنة في هذه الجزر تعتبر رمزًا للمكانة. ستعرف العديد من الطرق المقبولة مثل هذا الاتجاه غير الطبيعي على أنه "ضجيج في الخلفية"، لكن الخوارزمية الجديدة قادرة على تحديد وجود اتصالات حتى عندما يتعلق الأمر باتجاهات مختلفة - وحتى متعارضة -.

وأظهر تحليل بيانات البيسبول باستخدام الخوارزمية أن عدد الضربات وعدد القواعد وعدد الأدوار التي ينتجها اللاعب للفريق هي العوامل الرئيسية التي تحدد راتبه، بينما وضعت الأساليب الإحصائية الأخرى ثلاثة عوامل أخرى في الاعتبار. أعلى القائمة. من على حق؟ ويعتزم الباحثون السماح لعشاق لعبة البيسبول بتحديد العوامل التي تؤثر - أو ينبغي أن تؤثر - على رواتب اللاعبين.

تقول هيلاري بينوكين: "على عكس الطرق الأخرى، تعطي طريقتنا درجة عالية لمجموعة واسعة من أنواع العلاقات المخفية في قواعد البيانات الكبيرة، ولكنها قادرة أيضًا على إعطاء نفس الدرجة للعلاقات المخفية بسبب ضوضاء الخلفية". ويضيف ياكير رشيف: "بمعنى آخر، إنه قادر على العثور على أشياء مثيرة للاهتمام لم تتوقع العثور عليها، والتي يصعب اكتشافها باستخدام طرق التحليل الأخرى".

أما بالنسبة لهيلاري وليكير، فيبدو أن العمل معًا على الخوارزمية ساعدهما في تحديد نوع العلاقة التي حصلت على أعلى الدرجات بالنسبة لهما، وهي الزواج. "إنه لأمر رائع حقًا بالنسبة لنا أن نشترك في حب الرياضيات"، يقول الزوجان اللذان يشتركان في هوايات مشتركة أخرى - العزف على البيانو والجري والطهي.

تعليقات 3

  1. هل من الممكن حتى إثبات عدم وجود اتصالات بين الأشياء؟

    لا يبدو لي أن مصطلح العقدة المستخدم في التحليلات الرياضية الإحصائية كما في المقالة مرتبط بمصطلح العقدة الحقيقية. الاتصال الحقيقي هو مجرد اتصال مادي! صحيح أن الارتباط الإحصائي يمكن التكهن بوجود اتصال مادي، لكن لا يوجد دليل على ذلك، ومن المؤكد أنه لا يمكن إثبات عدم وجود اتصال حقيقي.

  2. جميل جدا!
    سيكون من الجميل أن تعطي روابط ومزيد من المعلومات حول الأشياء المكتوبة في المقالة؛ بالنسبة للمقالة المعنية على سبيل المثال.

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.