تغطية شاملة

للبحث عن فكرة - وليس كلمة رئيسية

يساعد الباحثون في مختبر أبحاث IBM في حيفا في تطوير أنظمة للبحث باستخدام المعرفة أو الأفكار بدلاً من الكلمات الرئيسية

العلم

الرابط المباشر لهذه الصفحة: https://www.hayadan.org.il/ibm260805.html

أصبحت محركات البحث منذ فترة طويلة جزءًا من روتيننا اليومي. حتى أن اللغة الإنجليزية المنطوقة نمت وأنشأت فعلًا جديدًا - لـ Google - يعني "البحث في Google". نحاول مرارًا وتكرارًا تحديد الكلمة الرئيسية الصحيحة، ثم النقر عليها على أمل تحديد المحتوى الذي نحتاجه. ولكن، عند البحث عن المعرفة والأفكار الجديدة، لماذا نكتفي بالكلمات الرئيسية فقط؟

أدى هذا السؤال إلى إجراء بحث مكثف في مجال تحليل النصوص، وهي تقنية قوية تسمح للمستخدمين باختراق أحشاء المعلومات غير المنظمة والبحث عن أفكار فيها - بدلاً من الكلمات الرئيسية. يمكن العثور على المعلومات غير المنظمة في مجموعة واسعة من المصادر - المستندات النصية أو ملفات الصور أو الصوت أو الفيديو أو المدونات أو البريد الإلكتروني. وتتميز جميعها بتنسيق لا يتضمن مفتاحًا محددًا مسبقًا، وتشكل تحديًا للباحث ونظام البحث.

يلعب علماء مختبر أبحاث IBM في حيفا الآن دورًا رئيسيًا في تطوير بنية إدارة المعلومات غير المنظمة - UIMA - والتي تم تقديمها بالفعل كنظام مفتوح المصدر، وهي قادرة على معالجة هذه المعلومات غير المنظمة من أجل فهمها. المعاني والسياقات والحقائق ذات الصلة الواردة في المحتوى الذي تم تحليله. تسمح UIMA للبرنامج بالبحث وإعطاء معنى لمختلف أشكال المعلومات، وتزويد المستخدم بالبحث على مستوى المفهوم - وليس على مستوى الكلمات الرئيسية.

من أجل تبسيط وتسهيل إنشاء تطبيقات تحليل النص، قامت شركة IBM بدمج UIMA في خط إنتاج تكامل معلومات WebSphere الخاص بها - خادم التطبيقات الخاص بها. يعد نظام WebSphere Information Integrator OmniFind Edition أول منتج برمجي يقوم بمعالجة المعلومات بناءً على معيار UIMA، ويتضمن نظام OmniFind أيضًا خوارزمية استرجاع المعلومات وقدرات إضافية تم تطويرها في مختبر أبحاث IBM في حيفا. تعمل هذه الإمكانات على توسيع منصة UIMA، وتمكين الإنشاء التلقائي لفهرس يتيح الاسترداد السريع للمعلومات من النص الذي تم تحليله.

ويوضح روني لامبل، مدير مجموعة استرجاع المعلومات في مختبرات IBM في حيفا، أن النظام يأخذ مجال تحليل النص خطوة أخرى إلى الأمام، ويتيح التطوير السهل والسريع للتطبيقات التي تسمح بتحديد المعرفة والبحث عنها واسترجاعها من المخزن. النصوص.

عادةً ما يتم البحث في مستودعات المستندات باستخدام لغة استعلام خاصة - أو من خلال الجمع بين الكلمات الرئيسية. يوفر تحليل النصوص ويحدد بنية المحتوى غير المنظم من خلال تحديد المصطلحات الأساسية مثل أسماء الأشخاص والمنظمات والأحداث - والعلاقة بين هذه العوامل الرئيسية، كما هي مخفية في النص. يمكن لتحليل النص أيضًا تحديد المفاهيم الجديدة أو الحقائق غير المألوفة - وفهمها في السياق الذي تظهر فيه في المستند غير المنظم. لذلك، على سبيل المثال، عندما يبحث المستخدم عن "زعماء العالم"، سيقوم النظام باسترداد معلومات حول الرؤساء ورؤساء الوزراء والزعماء الدينيين - حتى لو لم يدرج المستخدم هذه المصطلحات في استعلامه.

لقد أثبت تحليل النصوص فعاليته بالفعل في أنظمة الإنذار المبكر ومراكز خدمة العملاء والتطبيقات الطبية. تُستخدم الحلول من مجال تحليل النصوص في هذه المجالات من أجل كشف واكتشاف الصعوبات بين الأنواع المختلفة من المعلومات والحقائق المخفية في نقاط مختلفة في المستندات والملفات المختلفة. في إحدى الحالات، استخدمت إحدى الشركات منصة UIMA لتطوير حل للتنقيب عن النصوص يسمح لمصنعي السيارات بمعالجة المعلومات غير المنظمة الواردة في مطالبات إصلاح الضمان وسجلات الصيانة وطلبات الإصلاح وسجلات مكالمات خدمة العملاء. يتم استخدام المعلومات المجمعة لتوفير إنذار مبكر حول المشاكل في المنتجات المطروحة في السوق.

قامت شركة أخرى بتطوير سلسلة من مكونات تحليل النص التي تسمح بالكشف عن النشاط الإجرامي أو الإرهابي والتعرف عليه. ويقوم النظام بتحليل المعلومات مثل التقارير الميدانية وسندات الشحن ونصوص التنصت - ويقارنها مع المقالات الإخبارية والمنشورات وبيانات تحويل الأموال الدولية والمحلية.

ويضيف روني لامبل أن العمل في حيفا يركز على مجال البحث الدلالي، باستخدام المعرفة أو الأفكار – القادمة لاستبدال البحث المعتمد على الكلمات الرئيسية. أثبتت تكنولوجيا البحث الدلالي التي تم تطويرها في حيفا نفسها في سلسلة من المسابقات الدولية، مثل INEX، حيث يتم استخدامها للبحث واستخراج المعلومات شبه المنظمة من المستندات المكتوبة بتنسيق XML.

تم تسريع تطوير UIMA بفضل العمل المشترك مع DARPA - منظمة التطوير المركزية التابعة لوزارة الدفاع الأمريكية. وقد ساهم عدد من الجامعات ومعاهد البحوث الرائدة، فضلاً عن منظمات البحث والتطوير في تقدم هذه العملية. بعض الجامعات المشاركة في جهود التطوير، مثل جامعة كارنيجي ميلون، وكولومبيا، وستانفورد، وجامعة ماساتشوستس، تستخدم بالفعل UIMA في الدورات والمشاريع في مجالات البحث.

وقد أعلن أكثر من 15 مصنعًا للبرمجيات بالفعل أنهم سيعتمدون UIMA على أساس تجاري. ومن المتوقع أن تقدم هذه الشركات تطبيقات برمجية تتوافق مع هذا المعيار وحلولاً وخدمات تتعامل مع الاحتياجات الخاصة لمختلف الصناعات.

https://www.hayadan.org.il/BuildaGate4/general2/data_card.php?Cat=~~~249888080~~~207&SiteName=hayadan

ترك الرد

لن يتم نشر البريد الإلكتروني. الحقول الإلزامية مشار إليها *

يستخدم هذا الموقع Akismat لمنع الرسائل غير المرغوب فيها. انقر هنا لمعرفة كيفية معالجة بيانات الرد الخاصة بك.