تغطية شاملة

حكمة الحشود وخوارزمية جوجل

وتمتد ظاهرة جوجل أيضًا إلى مجال البحث الأكاديمي

آفي بيليزوفسكي

ومع تغلغل جوجل في إسرائيل، يتزايد الاهتمام بهذه الظاهرة غير العادية. صدر مؤخراً كتاب "حكمة الجمهور" عن دار النشر "العبرية" بالتعاون مع دار نشر كيتر. للكاتب جيمس سورويتسكي. ومن بين الأمثلة العديدة، يتضمن الكتاب أيضًا قصة جوجل: إليكم الاقتباس (ص 34، من انجليزية جود شيبا):
"بدأت Google في عام 1998، في الوقت الذي بدا فيه أن Yahoo قد سيطرت على أعمال البحث - وإذا تعثرت Yahoo، فسيظل Alta-Vista أو Lycus في الساحة، ولكن في غضون سنوات قليلة أصبح Google محرك البحث المفضل لجميع مستخدمي الإنترنت، وذلك ببساطة لأن Google يجد الصفحة الصحيحة بسرعة أكبر. وتعتمد طريقة جوجل في القيام بذلك، والتي تتلخص في مسح 3 مليارات صفحة ويب، على حكمة الجماهير.
في جوجل، يحافظون على سرية تفاصيل التقنية، لكنهم يكشفون أن في قلب نظام جوجل توجد خوارزمية PageRank، والتي تم تعريفها لأول مرة من قبل مؤسسي الشركة، سيرجي برين ولاري بيج في عام 1998، في مقال أصبح الآن عنوانًا أسطوريًا "تشريح محرك بحث لصفحات الويب ذات النص التشعبي في قانا بحجم كبير". هذه الخوارزمية هي طريقة حسابية تسمح لجميع صفحات الويب بتحديد أي منها أكثر صلة ببحث معين. وهنا صياغة جوجل:
يعتمد نظام PageRank على الطبيعة الديمقراطية الفريدة للويب، وذلك باستخدام شبكة واسعة من الروابط كمؤشر على "قيمة" موقع معين. في الأساس، يفسر Google الرابط من الصفحة "أ" إلى الصفحة "ب" على أنه "صوت" من الصفحة "أ" إلى الصفحة "ب". لكن جوجل لا ينظر فقط إلى مقدار "التصويتات" أو الروابط التي تتلقاها الصفحة؛ كما يقوم بتحليل صفحة التأشير. إن الأصوات الصادرة من الصفحات التي تعتبر في حد ذاتها "مهمة" لها قيمة أكبر وتساعد في جعل الصفحات الأخرى "مهمة". (وهذا هو الاقتباس من الكتاب).

ما هي بالضبط حكمة الحشود - أو كما يسميها البعض أيضًا حكمة السرب (ومن بين الأمثلة من الطبيعة هناك أيضًا قصص عن الطريقة التي يجد بها سرب من النحل حقل الزهور الذي يحتوي على أكبر قدر من الرحيق). في ظل الظروف المناسبة، قد يكون القرار الذي تتخذه مجموعة كبيرة قرارًا ذكيًا، وغالبًا ما يكون أكثر حكمة من قرار أذكى الأشخاص في المجموعة. وهذا فرع من فروع الاقتصاد، في رأي سوروفيتسكي، لم يحظ بالاحترام الذي يستحقه. هذه الظاهرة أيضًا غير بديهية، لكن اتضح أنها موجودة. في أحد المعارض الزراعية في القرن التاسع عشر، طُلب من الزوار المراهنة على وزن الثور. على الرغم من وجود مربي ثيران محترفين بين المقامرين، وربما أيضًا أشخاص يعرفون الإجابة الحقيقية، إلا أن معظم الناس خمنوا للتو. ورأى الباحث فرانسيس جالتون أن متوسط ​​نتيجة التخمين من قبل قلة من الحكماء وكثير من الحمقى سيكون بعيدًا عن الواقع لكنه تفاجأ بأن الوزن شبه دقيق (في الواقع كان المتوسط ​​19 ووزن الثور 542.9 كجم).
نوع آخر من حكمة الجماهير معروف لنا جميعًا - سوق الأوراق المالية. وحتى هناك، تعرف الجماهير متى تدخل السهم ومتى تخرج، بمجرد ظهور شائعات عن أي تغيير في الشركة. على العكس من ذلك، تتخذ البورصات إجراءات عقابية ضد أولئك الذين يستخدمون المعلومات الداخلية. اتضح أنه حتى الرهانات في نوادي الرهان تعكس في بعض الأحيان النتيجة النهائية (على سبيل المثال، فيما يتعلق بفوز الأوسكار). باختصار كتاب مثير للتفكير.

متوسط: الخوارزمية ليست سوى جزء صغير
وفي الموضوع نفسه، ألقى أورين إيتزيوني، الباحث في مجال محركات البحث من جامعة واشنطن في سياتل، والذي وقع على ثلاث شركات ناشئة (إحداها إسرائيلية)، محاضرة هذا الأسبوع حول محركات البحث المستقبلية للطلاب وأعضاء هيئة التدريس وأعضاء هيئة التدريس الخريجين في المركز متعدد التخصصات في هرتسليا. وردًا على سؤالي بخصوص محرك جوجل، قال إتزيوني: "إن خوارزمية جوجل الشهيرة أقل تحديدًا لجودتها بكثير مما يعتقده الناس. يتكون بحثهم من العديد من براءات الاختراع التي لم يكشفوا عنها، والواضح هو أن الخوارزمية الأصلية جزء صغير. على سبيل المثال، يولي جوجل أهمية للكلمات التي يتم كتابتها في وصف الصفحة في المكان الذي ترتبط منه الصفحة (
Anchortext) "عندما تقوم بإنشاء رابط إلى صفحتي الرئيسية، اكتب شيئًا مثل الصفحة الرئيسية لـ Oren Etzioni عليها. واكتشفوا أن الكلمات القصيرة التي تظهر على الرابط هي ملخص ممتاز لما هو موجود في الصفحة المرتبطة."
يقول إيتزيوني إن قوة جوجل ترجع إلى حقيقة أنه في ذلك الوقت، اعتقدت المواقع الأخرى أن البحث كان سلعة، بل قامت بالاستعانة بمصادر خارجية لمحرك البحث الخاص بها، عندما حولت ياهو ولايكوس وآخرون صفحتهم الرئيسية إلى بوابات بإضافة الأخبار والأبراج وما إلى ذلك. . جاءت جوجل واستثمرت مبالغ ضخمة في محرك بحث وبالتالي حصدت السوق بأكمله.
يبحث إيتزيوني ومجموعة يقودها حاليًا عن كيفية منح محركات البحث الذكاء الاصطناعي حتى يتمكنوا من فهم الإجابة على استعلام واستخراجها من جميع صفحات الويب التي يتلقى متصفحي اليوم رابطًا إليها. يجب عليهم في الواقع "فهم" محتوى الصفحات. ويقدر أن الأمر سيستغرق عشر سنوات أخرى قبل أن تتمكن محركات البحث من الوصول إلى مثل هذه المعلومات الاستخبارية.

متوسط: الاستعلام إلى جوجل إسرائيل
ومرة أخرى في نفس الموضوع: لماذا تقوم خوارزمية أخبار Google، التي من المفترض أن تأخذ وتجمع الأخبار حول نفس الموضوع، بإنشاء جزر مكونة من 2-3 عناصر إخبارية لكل منها؟ على سبيل المثال - ظهرت أخبار حفل جائزة دان دافيد في جامعة تل أبيب في اليوم التالي للحفل (22/5) في ملفين مختلفين على الأقل؟ في وقت سابق، مع وفاة البروفيسور يوفال نيمان، ظهرت كل الأخبار تقريبًا بشكل فردي؟

دودة الكتب

https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~484948358~~~42&SiteName=hayadan

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.