المــوقـــع الــرســمى الـخــــاص بــ "د/ تــامر المـــــلاح"

"تكنولوجيا التعليم " الحاسب الألى " الانترنت " علوم المكتبات " العلوم التربوية " الدراسات العليا "


2.1 – الفهرسة الآلية في المكتبات ومراكز المعلومات : 

1.2.1 – البحث عن المعلومات أساس المعرفة : 
مشكلة التصنيف والبحث عن المعلومات مشكلة قديمة قدم المعرفة الإنسانية نفسها ، وقد تقدمت أساليب البحث عن المعلومات مع تقدم وتطور المعرفة الإنسانية وارتقت بارتقائها . أما تعبير انفجار الإنتاج الفكري فقد ظهر لأول مرة عام 1851م حيث حذر جوزيف هنري من نتائج هذا الانفجار قائلاً :
" مالم ترتب هذه الكميات الضخمة بطريقة ملائمة ، ومالم تعد لها الوسائل اللازمة للتحقق من محتوياتها ، فسوف يضل الباحثون سبيلهم بين أكداس الإنتاج الفكري ، كما أن تل المعلومات سوف يتداعى تحت وطأة وزنه ، ذلك إن الإضافات التي ستضاف إليه، سوف تؤدي إلى اتساع القاعدة ، دون الزيادة في ارتفاع الصرح ومتانته ". 
وقد مضى على هذا التحذير حوالي قرن ونصف القرن من الزمن ، دون أن تتغير أهمية مضمونه . إذ إن الإنسان في كفاحه الدؤوب نحو اكتساب خبرات ومعارف جديدة وتسجيلها ، كان بحاجة دائماً إلى أدوات تساعده في تنسيق هذه المعلومات واسترجاعها بسهولة وسرعة ، وقد تطورت هذه الأدوات مع زيادة حجم المعلومات وتطور الوسائط المخزنة فيها . 
واستطاع علم المكتبات أن يوفر أدوات أساسية لتصنيف وتحليل واسترجاع المعلومات ، مما سهل مهمات عمل الباحثين في النصف الأول من هذا القرن إلا أن تسارع وتيرة تضاعف حجم المعلومات وصولاً إلى ظاهرة (انفجار المعلومات) طرح من جديد مشكلة المعلومات كإحدى أهم المشكلات التي يواجهها علم المعلومات في النصف الثاني من القرن العشرين ، ولقد ترافق ذلك كله مع ظهور شبكة إنترنت التي اختلفت الآراء فيها ، فمنهم من أطلق عليها اسم المكتبة الإلكترونية ومنهم من تجاهل دورها كمصدر أساسي من مصادر المعلومات في نهاية القرن الماضي . 
ونحاول في هذا الفصل أن نسهم في الحوار الدائر حول شبكة المعلومات الدولية : أهميتها ، وسائل الفهرسة الآلية المستخدمة فيها ، العلاقة بينها وبين المكتبات ، مدى إفادتها من علم المكتبات ؟ 

2.2.1 – التأثير المتبادل بين المكتبات وشبكات المعلومات 
الدولية :

1.2.2.1 – مكتبات المستقبل : 
لا يخفى على أحد مدى عمق العلاقة بين الخدمات المكتبية وخدمات المعلومات الإلكترونية ، فقد نشأت شبكات المعلومات الحديثة في رحاب المكتبات ولا تزال حتى اليوم تؤثر فيها وتتأثر بها . وها هي نماذج مكتبات المستقبل تبدأ بالظهور في الدول المتقدمة ، وتسعى لإفادة روادها من الخدمات الحديثة بهدف تحقيق التوازن كامل بين التكنولوجيا المتقدمة ورفوف الكتب التقليدية والرفوف المفتوحة من المواد المرجعية . ففي نيويورك تم إنشاء مكتبة الأعمال والصناعة والعلوم Science, Industry and Business Library (SIBL) التي بلغت كلفة إنشائها / 100 مليون دولار / ، بفضل إسهام القطاعين العام والخاص ، وقد حرص مصمم المكتبة على وضع أحدث التطورات والابتكارات في مجال الديكور الداخلي والتكنولوجيا . وتغطي المكتبة اهتمامات الجماعات العلمية والأعمال الصناعية ، وتضم أكثر من /1.2/ مليون مجلد من مجموعات الأبحاث الجارية فقط ، ويصل طول رفوف المكتبة إلى أكثر من /50/ خمسين كيلو متراً موضوعة في خمسة طوابق من الرفوف الإلكترونية، كما تتضمن المكتبة مركزاً للمصادر الإلكترونية Electronic Resource Center (ERC) الذي يرتبط بشبكة مؤلفة من /70/ سبعين محطة عمل توفر النفاذ إلى أكثر من /100/ قاعدة بيانات مشغلة بواسطة الأقراص المتراصة CD-ROM’s ، وإلى ملفات وصحف ونصوص كاملة في الإنترنت ، ويوفر النفاذ إلى رابطة الشبكة العالمية www ، إضافة إلى /110.000/ عنوان دورية ومجموعة شاملة من براءات الاختراع وحوالي مليون مادة من المصغرات تؤلف معظم مواد المعاهد العلمية والأعمال . ويستطيع رواد المكتبة الاستفادة من تصنيف أسبوعي ويومي للافتتاحيات الجديدة المنشورة في www .ومراجعة شاملة للبحث في قواعد البيانات الإلكترونية للمكتبات . وتضم مكتبة الأعمال والصناعة والعلوم /500/ قاعة مطالعة حديثة مزودة بأحدث أدوات العمل بما في ذلك حواسب محطات عمل ، وهي تستقبل يومياً أكثر من /2500/ شخص . 
وفي سان فرانسيسكو بلغت كلفة إنشاء المكتبة العامة /140/ مليون دولار San Francisco Public Library (SEPL) وهي مرتبطة بشبكة حاسوبية كبيرة مؤلفة من /1100/ محطة عمل توفر النفاذ إلى الإنترنت ، وتحتوي أدلة منتجات الوسائط المتعددة Multi Media ، كما تتضمن مركز اكتشاف إلكتروني للأطفال وتوفر النفاذ إلى قواعد البيانات النصية والرقمية ، وتقارير الأمم المتحدة الإحصائية، وتقارير في العلوم التطبيقية والملخصات التكنولوجية ، وتستقبل يومياً أكثر من /6000/ شخص . 
ويلاحظ المختصون أن مجمعات المكتبات العامة الكبرى في فرنسا وبريطانيا وألمانيا واليابان ، بنيت أو أعيد تنظميها وتم تجهيزها بأحدث الوسائل التكنولوجية بما في ذلك الرفوف الإلكترونية ، وتكنولوجيا المعلومات وشبكات المعلومات التي توفر النفاذ إلى إنترنت وإلى مصادر إلكترونية داخلية على أقراص متراصة CD-ROM’s ، وكذلك الأمر في الوطن العربي فقد بدأت المكتبات الكبرى الحديثة بالأخذ بأحدث تقانات المعلومات وخاصة في المكتبات المنشأة حديثاً . ففي الإسكندرية تم إنشاء مكتبة كبرى تستعيد دور الإشعاع الثقافي الحضاري الذي أدته مكتبة الإسكندرية التاريخية ، ولكنها أقيمت وفق أحدث أساليب تكنولوجيا المعلومات ، وهي تشاد على موقع تبلغ مساحته /45.000م‌2/ ، وتبلغ المساحة الإجمالية للطوابق /80.000م2/ وتضم ثمانية ملايين كتاب وخمسين ألف مخطوطة وخمسين ألف خارطة وتضم خمسين ألف جهاز صوتي أو مرئي أو حاسوبي و قاعدة بيانات OPAC ، وتوفر لروادها إمكانية النفاذ إلى إنترنت عبر طرق المعلومات السريعة ، وكما تضم المكتبة مركزاً للمؤتمرات يتضمن قاعدة المؤتمرات /1700 مقعداً / وقاعات للندوات /400 مقعداً / ، ومتاحف للعلوم والخط والآثار ، والمعهد العالي لعلوم المعلومات ، ومخبر التخزين والحفظ ، إضافة إلى المكتبة لتكون مرجعاً ومصدراً مهماً للمعلومات ، ليس فقط لمدينة الإسكندرية أو لمصر وحدها ، وإنما أيضاً للباحثين والمهتمين جميعهم في البلدان العربية ومنطقة البحر الأبيض المتوسط، حيث يمكن النفاذ إلى قواعد بياناتها عبر طرق المعلومات السرية . 

2.2.2.1 – إنترنت والمكتبات : 
وبالمقابل بدأت شبكة إنترنت تثبت جودها كمصدر مهم للمعلومات ، وهي تنافس في ذلك المكتبات التي كانت حتى وقت قريب المصدر الوحيد تقريباً للمعلومات ، وإن السؤال اليوم : ما فائدة الشبكة ؟ هو كالسؤال : ما فائدة الكتب ؟ فالشبكة اليوم توفر أجوبة ملائمة لأي استفسار حول معلومات عامة أم علمية أم اقتصادية أم حول الشؤون الحكومية أم المعلومات المتعلقة بالأشخاص ، ويزداد كل يوم عدد المشتركين في إنترنت ، كما يزداد عدد الناشرين فيها ، وذلك بعد أن أصبح النشر في إنترنت سهلاً ، وأصبح بإمكان الأفراد غير المتخصصين أن يستخدموا إنترنت ليس للبحث عن المعلومات فقط وإنما أيضاً لنشر ما يرغبون أو ما يعتقدون أنه قد يفيد مشتركين آخرين في إنترنت . 
ومع الاهتمام المتزايد بإنترنت ، سارعت الشركات إلى استثمار هذه الظاهرة، وأسست مواقعها التي تتضمن معلومات تفصيلية وشاملة عن أعمالها واستثماراتها ومنتجاتها ودعايات بهدف ترويج مبيعاتها ، ولا نرى نظيراً لتوجه هذه الأعداد المتزايدة نحو إنترنت سوى الهجرات الجماعية التي شهدها الغرب الأمريكي بحثاً عن مناجم الذهب ، وهو ما عرف في ذلك الوقت باسم ( حمى الذهب ) ، مما أدى إلى استمرار توسع مناجم الذهب لفترة طويلة . 
ولعل هذا التوسع المستمر هو إحدى الظواهر الإيجابية التي جعلت إنترنت أكثر آليات نشر المعلومات اتساعاً ، حيث يستطيع الباحث العثور على كل ما يحتاجه في بحوثه من معلومات . 
إلا أن هذا التوسع يشكل في الوقت نفسه نقطة الضعف الكبرى في شبكة إنترنت ، فهنالك كمية هائلة جداً من المعلومات تضاف يومياً إلى إنترنت . وهي معلومات متنوعة جداً ، مثل الألعاب والإعلانات التجارية والبيانات الخام العلمية والأعمال المالية ومجموعات النقاش والبريد الإلكتروني والمؤتمرات الفيديوية والمواقع التي تسمح للمستفيد بزيارة المدن والمتاحف والأسواق وفهارس المكتبات العامة وملخصات التقارير التكنولوجية وقواعد بيانات النص الممنهل HTML ، وهذا التنوع الشديد يجعل تصنيف كل هذه المواد وبالتالي العثور عليها صعباً جداً، حيث أن الاستفادة من الفهارس الآلية في عملية البحث عبر الإنترنت كثيراً ما تقودنا إلى نتائج تكثر فيها الوثائق البعيدة عن الموضوع المطلوب، وقد تفشل في جلب بعض الوثائق المهمة في مجال موضوع البحث . 
نقطة ضعف إنترنت الكبرى هي أن كثيراً من معلوماتها عابرة ومؤقتة وتخزن في قواعد عديمة الشكل ومشوشة ، إذ أن إنترنت وخصوصاً مواقعها في ( رابطة الشبكة العالمية www ) لم تصمم لدعم النشر المنظم واسترجاع المعلومات كما في المكتبات . وباختصار ، الشبكة ليست مكتبة رقمية ، ولكي تستمر وتزدهر، ستحتاج للاستفادة من الخدمات التقليدية للمكتبة بهدف تنظيم استرجاع المعلومات من الشبكة . ويأمل المستفيدون من الإنترنت أن تستطيع هذه الشبكة الإفادة من مهارات المكتبيين في التصنيف والاختيار بالتنسيق مع إمكانات علماء البرمجة الحاسوب من أجل أتمتة مهام فهرسة وحفظ واسترجاع المعلومات.


3.2.1 – محركات البحث Search Engines : 

1.3.2.1 – التعريف بمحركات البحث : 
حتى هذه اللحظة تتحمل التقانات الحاسوبية العبء الأكبر من مسؤولية تنظيم المعلومات في إنترنت ، لأن الاعتماد الكلي على المفهرسين البشريين سيجعل من المستحيل مواجهة هذا الإغراق اليومي لإنترنت بكم هائل متجدد من المعلومات ، ولذلك كان لا بد من اللجوء إلى البرامج الآلية التي تقرأ صفحات مواقع الإنترنت وتصنفها وتفهرس البيانات الرقمية . وقد لجأ مستثمرو إنترنت إلى هذا الحل البسيط مستفيدين من الانخفاض السريع والمستمر لأسعار الحواسب والبرمجيات ، مما يجنبهم النفقات الباهظة للفهرسة البشرية ، ومما يساعدهم في إنجاز الفهرسة المطلوبة بسرعة مناسبة لتوسع إنترنت المستمر ، وبما لا يقارن ببطء الفهرسة البشرية . 
ولكن ، هل الفهرسة الآلية هي حقاً الحل المناسب لاسترجاع المعلومات في الإنترنت ؟ هنا لا بد لنا من تفهم الطريقة التي تعمل بها محركات البحث ، وهي طريقة مختلفة تماماً عما تعتمده الفهرسة البشرية ، ونلاحظ بصورة أولية أن نتائج البحث في مواقع رابطة الشبكة العالمية (Web) تتضمن غالباً إحالات إلى مواقع لا علاقة لها بالموضوع ، بينما تهمل المواقع الأخرى التي تمتلك مواد مهمة . 
تستخدم شركات خدمات المعلومات الفورية برامج ذكية تسمى محركات البحث Search Engines أو زواحف الشبكة Web Crawlers أو عناكب Spiders أو روبوتات Robots ، وتتوضع محركات البحث في المخدم العام لشركة الخدمة الفورية في رابطة الشبكة العالمية web ، ذلك أنها تقوم بفهرسة المواقع المختلفة بشكل متعاقب مما يوحي بأنها تنتقل أو تزحف من موقع إلى آخر ، حيث تقوم بتحميل صفحات الموقع ثم تتفحصها وتستخلص فهارس المعلومات ، ويمكن القول إن محرك البحث يشمل برنامجاً يتسرب إلى ملايين الصفحات المسجلة في الفهرس بغية إيجاد الصيغ المطابقة لموضوعات البحث ثم يقوم بتصنيف هذه الصيغ وفقاً لمدى ارتباطها بموضوع البحث ، غير أن محركات البحث تعمل بأساليب مختلفة جداً طبقاً لشبكات الخدمات العديدة التي تعتمدها . وهنا نميز طريقتين : 

• الفهرسة البسيطة : تتضمن قراءة كلمات صفحات الموقع جميعها ، ثم معظم الكلمات الواردة في نصوص هذه الصفحات ككلمات مفتاحية لخدمة البحث . 
• الفهرسة الذكية : تتضمن إجراء تحليلات معقدة بهدف تعيين واصفات أو جمل تستخدم ككلمات مفتاحية لخدمة البحث . 

وبعد الانتهاء من تحديد الجمل أو الواصفات أو الكلمات المفتاحية يتم تخزينها في قواعد معطيات محركات البحث ، حيث يوضع إلى جانب كل كلمة عنوان يعينه محدد المصدر الموحد URL وبذلك يتم تحديد مكان وجود الملف . 
ومن المعروف أن معظم شركات الخدمة الفورية في إنترنت تستخدم برامج بحث تسمى المستعرض Browser ، فعندما يبحث المستفيد عن الصفحات التي تتضمن كلمة أو واصفة محددة ، يتم إحالة طلب المستفيد إلى قاعدة بيانات محركات البحث ويتم استحضار عناوين صفحات المواقع جميعها التي تتطابق مع طلب المستفيد ، حيث ينتج عن ذلك قائمة من العناوين التي يمكن أن نختار أية نقطة فيها ونؤشر عليها بالفأرة من أجل تحقيق الاتصال بأحد المواقع التي تستجيب للاستفسار المطلوب . 
وتستطيع محركات البحث أن تفهرس ملايين الصفحات كل يوم بما يضمن تحديث قواعد معطياتها بصورة مستمرة ، ومواجهة التوسع المستمر في تخزين المعطيات ، كما تستطيع من ناحية أخرى خدمة ملايين الاستفسارات ومواجهة التوسع المستمر في طلبات البحث . 
تستخدم بعض الشبكات الخاصة وسائل إضافية مثل مفكرة أو دليل المواقع Site Directory ) ) وهو أشبه بدليل الهاتف المفهرس حيث تتصل آلة البحث بالمواقع تباعاً وتبدأ آلة البحث ( الروبوت ) من الصفحة الأولى ( القائمة الرئيسة) المتصلة بباقي الصفحات ، وهكذا تستطيع آلة البحث تتبع كل الوصلات لمسح صفحات الموقع . وهنا يجب أن نشير إلى أن آلة البحث نفسها لا تعبر الشبكة (Web) ، بل هي تطلب الصفحات من قائمة المواقع المهمة وهي أكثر المواقع شعبية ، وقوائم من الوصلات الناتجة عن مسح Usenet أو أرشيف قوائم البريد . ويسجل الروبوت المعلومات البارزة مثلاً يمكن أن يمسح الكلمات المفتاحية أو العبارات التعريفية الوصفية أو مستخلص الصفحة ، أو يمكن أن يحلل النص الكامل للصفحة لاستنتاج الكلمات المفتاحية . 
وتؤدي الروبوتات أو محركات البحث عملها ضمن بيئة إنترنت أو إنترانت حيث تتميز هذه البيئة بشكلها التلقائي الذي لا يخضع لأي نوع من التخطيط المركزي ، وليس ثمة طريقة منهجية لحفظ المعلومات والوثائق ، مما يجعل الإبحار فيها صعباً ويستغرق وقتاً طويلاً ، ومما يجعلها أشبه بالمتاهة . 
وهنا يجب أن نشير إلى أن محرك البحث لا يعني المعنى الشعبي الشائع عن خدمات المعلومات المتاحة مثل AltaVista - Yahoo بل سنستخدم هذا المصطلح بمعنيين : 

• المعنى الأول : برنامج يستطيع المستفيد من خلاله تشكيل سؤال وتنفيذ بحث عن المعلومات . 
• المعنى الثاني : وهو البرنامج الذكي الذي تحدثنا عنه سابقاً وهو الذي يستدعي صفحات المواقع بصورة متعاقبة لفهرستها مما يوحي بأنه ينتقل بينها ويزحف إليها . مما استدعى تسميته بالزاحف Crawler أو المفهرس Indexer أو الروبوت (Robot) الذي يطلق عليها اختصاراً (bot) وتتجلى مهمة هذا البرنامج في إعداد قواعد بيانات قابلة للبحث أو فهارس وكشافات . ومن المفيد أن نلاحظ الفرق بين مفهوم " البحث Searching " وهو الفعل الذي يؤديه المستفيد عندما يسجل كلمة معينة أو عبارة للحصول على قائمة بالمواقع التي تحتوى على صفحات تستجيب لمتطلبات البحث ، وبين مفهوم " الزحف Crawling " وهو فعل العودة إلى مصادر البيانات لإعادة تحليل صفحات المواقع وتحديث الفهارس. 

ولعل أفضل محركات البحث هي المحركات التي تسمح للمستفيد بإجراء بحث شامل وتتميز بسهولة الاستخدام وسهولة الصيانة وإمكانية الفهرسة متعددة الجوانب . ولإنجاز هذه الأهداف لا بد من توافر المتطلبات التالية : 

• قابلية احتواء اللغة الطبيعية ونماذج الاستفسار البولياني وباقي النماذج . 
• ظهور نتائج البحث بشكل منمذج من أجل تطبيقات مختلفة . 
• الالتزام بمعايير إقصاء – الروبوت ، الذي يسمح للمخدمات في المواقع أن ترفض نفاذ الروبوت إلى الصفحات الخاصة غير المؤهلة للعرض أمام الجمهور. 
• قابلية التوليف الدقيق أو تشكيل معالجة الفهرسة بطرق مختلفة تحقق متطلبات متنوعة للمشرفين على فهرسة المواقع ، مثلاً لفهرسة معطيات موقع معين باستثناء ملفات تتمتع بصفات خاصة . 
• قابلية فهرسة نماذج مختلفة مثل : 
Plaintex (TXT) . HTML,Adobe Portable 
Document Format (PDF), Post Script (PS) Micro Soft RTEPDF, Frame Maker .Interchange Format (MIF). 
• دعم نظم تشغيل متنوعة مثل Windows NT, Unix وغيرها . 

2.3.2.1 – اختيار محرك بحث : 
يتألف البحث عادة من مجتزأين (Modules) يعمل كل منهما مع الآخر : 

• القطعة الأولى : هي المجتزأ (Module) الخاص بالفهرسة وهو المسؤول عن قراءة المعلومات في قواعد البيانات المختلفة ، حيث يمكن أن تكون قاعدة البيانات مؤلفة بكاملها من ملفات النص الممنهل HTML ، كما يمكن أن تضم مقداراً محدوداً من ملفات أخرى (عادة ASCII أو ATF ) . 
بعد الانتهاء من قراءة المعلومات سيتم وضع الكلمات المفتاحية الناتجة ضمن ملف الفهرسة الذي سيتضمن مؤشرات إلى المكان الدقيق لكل وثيقة.
ويشبه الفهرس كتاباً ضخماً يحتوي على الكلمات المفتاحية من كل صفحة من صفحات (Web) التي يجدها برنامج الفهرسة الآلية في طريقه وفي حال طرأ تعديل على الصفحة ، يتم تحديث الفهرس تلقائياً بالمعلومات الجديدة . ويمكن أن ينمو ملف الفهرس تلقائياً بالمعلومات الجديدة . ويمكن أن ينمو ملف الفهرس إلى أن يصبح حجمه هائلاً وفقاً لكميات البيانات المراد فهرستها ، ووفقاً لخوارزمية الفهرسة التي يمكن أن تساعد في ضغط حجم ملف الفهرس . 

• المجتزأ الثاني: هو محرك البحث الفعلي ، إنه المجتزأ الذي يستجوب ملف الفهرس يقوم ومقارنة الكلمات التي أدخلها المستفيد مع الكلمات المتضمنة في ملف الفهرس وإعادة النتائج . 

تعمل محركات البحث جميعها بالاعتماد على هذه المبادئ إلا أنها تختلف فيما بينها في تفاصيل طريقة العمل ، فمثلاً يستخدم بعضها تركيب ( كلمة / طور) وبعضها يعيد ملخصاً عن الوثيقة المطلوبة ، وأخرى ستعود فقط بإتاحة إمكانية الوصل مع الوثيقة المطلوبة . 
قبل تركيب محرك البحث ، يجب أن ينظم المستخدم جدول أولوياته فهل المطلوب هو سهولة استخدام المحرك وتركيبه وتوافر الدعم الفني أو المطلوب اختيار محرك بحث غير مكلف ، وأخيراً يجب دراسة حجم المشكلات التي قد يواجهها مستخدم محرك البحث ، وكم من الوقت يستغرق تركيبه ؟ وكم من الوقت يستغرق إعادة فهرسة الوثائق جميعها إذا تغير شيء منها؟. 
وعموماً ليس ثمة محرك بحث واحد يفي بمتطلبات مؤسسة تزويد خدمات المعلومات ولذلك لا بد من دراسة خصائص محركات البحث لاختيار ما يناسب متطلبات المؤسسة . 
عندما تختار مراكز المعلومات أو المكتبات محرك البحث تستطيع مقارنة الجدوى بين عدة محركات من حيث الكلفة والمواصفات الفنية . مثلاً : هل يتطلب تركيب محرك البحث المجاني وقتاً طويلاً ؟ وهل يصعب الحصول على الدعم الفني؟ . 
فإذا كانت الحاجة إلى الوقت وإلى وجود مساعدات البحث Search Utility لا تأتي ضمن أولويات الموقع ، فإن اختيار محرك البحث ذي الكلفة الأقل ربما يكون هو الخطوة الصحيحة . 
إلا أن هنالك مواقع تهتم بعامل الزمن وتعده من أولوياتها ، ومثل هذه المواقع ترى أن محرك البحث المجاني ربما يأخذ وقتاً أطول من المتوقع ، وكذلك قد يكون الدعم الفني صعباً ، وربما يستغرق وقتاً طويلاً في فهرسة وإعادة فهرسة المواقع ، وفي هذه الحالة قد تختار محرك بحث تجاري . لأن الكلفة المالية ستعوضها حتماً إمكانات السرعة في التركيب والبحث وخدمات الدعم الفني . 

3.3.2.1 – سلبيات الفهرسة الآلية : 
ذكرنا سابقاً أن الفهرسة الآلية تؤدي في كثير من الأحيان إلى إعطاء نتائج غير دقيقة للبحث ، كأن تتضمن الإجابة مئات من الصفحات التي لا تهم المستفيد في حين يتم إهمال عدد مماثل من الصفحات المهمة . 
إن إنترنت المؤلفة من خليط غير متجانس من المواد المختلفة والمتباينة تبايناً كبيراً تفتقر إلى المعايير التي تسهل الفهرسة آلياً ، كما أن محركات البحث - على عكس المفهرسين من البشر – تجد صعوبة في تحديد خصائص الوثيقة أو نوعها سواء أكانت شعراً أم مسرحية أم إعلاناً . 
ولم تنشأ صفحات web بطريقة مناسبة تسمح للبرامج الآلية أن تستخرج بشكل موثوق ترتيب المعلومات ، مثلما يمكن للمفهرس البشري أن يجده عبر معاينة خاطفة : الكاتب ، تاريخ النشر ، طول النص ، ومحتوى الموضوع ( وهذه المعلومات معروفة باسم البيانات الوصفية matadata ) . 
بعض البرامج الآلية تعود بإحصاءات حول مدى تكرار الكلمات في الصفحات التي تتفحصها ، وتضع جدولاً بالمواقع التي تكرر إحدى الكلمات مرتبة وفق الإحصاءات الناتجة . وذلك يؤدي إلى أن يحاول موقع ما أن يوجه الانتباه إليه من خلال تكرار كلمات معينة مرغوبة ومطلوبة من الجمهور دون أن يكون لها علاقة بمضمون صفحات الموقع . بينما يستطيع المفهرسون من البشر اكتشاف هذه الحيل الساذجة بسهولة . 
ويستطيع المفهرسون من البشر وصف عناصر الصفحات الفردية من الأنواع جميعها ( النصوص – الصوت – الصور – الفيديو ) كما يستطيعون توضيح كيفية توافق هذه الأجزاء مع بعضها بعضاً ضمن قاعدة معطيات متجانسة. 
ولذلك يتجه البحث العلمي اليوم نحو حل بعض مشكلات مناهج التصنيف الآلي ، وخاصة من خلال ضرورة إلحاق البيانات الوصفية Metadata بالملفات جميعها ، هكذا تستطيع برامج الفهرسة أن تجمع هذه المعلومات وتجدد اتجاه البحث. وأكثر المحاولات تقدماً في هذا المجال يقدمها برنامج ( دبلن للبيانات الوصفية Metadata Dublin Core ) ويتراوح تصنيف البيانات الوصفية من العنوان أو الكاتب إلى نوع الوثيقة ( نص أو فيديو ) . 








صفحة الفهرسة الآلية الفهرسة البشرية 

الموارد المائية ،دبلن جين، دو الكاتب – " جين دو " 
الموارد المائية في دبلن "جين بسيطة ديسمبر ، كانون الأول ، 1996، تاريخ النشر : 12 ديسمبر /
دو" Jane Doe 12 ديسمبر / تقرير ، يعتمد ، مسح ، قام به، كانون الأول 1996 .
كانون الأول 1996م يعتمد هذا ديسمبر، كانون الأول، جيم ، الموضوع : " الموارد المائية 
التقرير على المسح الذي قام يتفحص، تغيرات، أنهار، في دبلن ، أوهايو " مسح دبلن 
به "جيم سميث" Jim Smith في منطقة ، … أوهايو من قبل جيم سميث
1 ديسمبر /كانون الأول 1996م 1 ديسمبر / كانون الأول 
وهو يتفحص التغيرات في " جين دو " 1996 " . 
أنهار منطقة دبلن ، أوهايو. ذكية 12 ديسمبر / كانون الأول1996 التغطية الجغرافية : " دبلن ، 
1 ديسمبر / كانون الأول 1996 أوهايو" . 
" جيم سميث " 
" دبلن ، أوهاريو " 

الفهرسة الآلية ، ، المستخدمة بوساطة برمجيات زواحف Web ، تحلل صفحة ( الجدول اليميني) بتصفيف معظم الكلمات كمصطلحات فهرسة ( في المركز نحو الأعلى ) ، أو بتجميع كلمات ضمن جمل بسيطة ( المركز نحو الأسفل ) . بينما تعطي الفهرسة البشرية ( إلى اليسار ) قرينة إضافية حول موضوع الصفحة . 


وحيثما تكون النفقات مبررة ، بدأ المفهرسون البشر مهمتهم الشاقة في تجميع مسارد بعض مواقع Web . فمثلاً ، قاعدة البيانات ياهو Yahoo ، إحدى المغامرات التجارية ، تقوم بتصنيف المواقع بطريقة تكشيف المجال العريض للموضوعات . ومشروع البحث العلمي في جامعة ميتشيغان University of Michigan هو أحد الجهود المختلفة من أجل تطوير توصيفات أكثر منهجية للمواقع التي تحتوي على مواد ذات اهتمام علمي . 
وكمثال على التآلف بين مزايا برامج البحث الآلي ومزايا الفهرسة البشرية، 
يمكن أن نأخذ مثال المعايير التقنية التي تسمى خطة من أجل انتقاء محتويات إنترنت : Platform for Inteernet Contents Selection (PICS) ، حيث يستطيع الجمهور أن يوزع إلكترونياً توصيفات الأعمال الرقمية بصيغة بسيطة قابلة للقراءة من الحاسوب . وتستطيع الحواسيب أن تعالج هذه العبارات التعريفية Labels لحجب المستفيدين آلياً عن المواد غير المرغوبة أو توجيه عنايتهم إلى مواقع ذات أهمية استثنائية . 
وقد كان الدافع الأصلي لابتكار (PICS) هو السماح للآباء والمعلمين بحجب مواد لمسوا أنها غير ملائمة للأطفال الذين يستخدمون الشبكة . 
وتتجه PICS اليوم إلى توسيع هذا المفهوم بهدف تخويل المستخدمين بالتحكم بما يستقبلونه . 
ويمكن لعبارة التعريف PICS أن تصف مظهر الوثيقة أو الموقع وتصنيف الموضوعات ودرجة اعتماد المعلومات في موقع معين ومدى أمن الموقع وخلوه من الفيروسات . 
وتستطيع شركات التزويد دمج عبارات التعريف مباشرة بوثائق وصفحات Web ، كما يمكنها أن تحتفظ بها مجمعة ضمن قاعدة بيانات مستقلة يرجع إليها من يرغب بالاسترشاد بها . وإذا كان معظم مستخدمي إنترنت يعدون الوسائل التقنية المتوافرة حالياً للبحث عن المعلومات أمراً مزعجاً ويستهلك كثيراً من الوقت ، فإن مبادرات عديدة انطلقت لتطويرها ، ومن أهمها المبادرة الخدماتية الحديثة : البحث البشري - هيومن سيرتش Human Search التي تعتمد على فريق من جامعي المعلومات الذين يتمتعون بخبرة البحث في شبكة Web ، ويقومون بالبحث بالنيابة عن المستفيدين ، وما على المستفيد سوى إرسال طلبه بدقة عبر البريد الإلكتروني على عنوان الشركة في صفحات Web وهو:(w.w.w.humansearch. wl. com) . 
وبعدئذ يقوم جامع المعلومات الشخصي بالبحث عن البيانات وإرسال النتائج عبر البريد الإلكتروني إلى المستفيد . ويمكن القول إن هذه الطريقة قد تغدو أحد الأساليب المستقبلية للبحث عن المعلومات عبر إنترنت ، تماماً كما هو حالة ( الوكلاء الأذكياء ) التي تعتمد على برامج ذكية تؤدي دور وكيل المستفيد ، وهي برامج متطورة مرتكزة على نظام خاص من الذكاء الصنعي المصمم لتقليد الدماغ البشري . كما أنها قادرة على ترجمة اللغات البشرية إلى مفاهيم يتقبلها جهاز الكمبيوتر . فإن هذا النظام يتأقلم تدريجياً مع احتياجات المستفيد الخاصة من المعلومات ، حيث يجري تدريبه مرحلياً على العثور المعلومات الشخصية التي ينشدها كل مستفيد أو قطاع . 
ونورد فيما يلي مثالاً لشكل العبارة التعريفية :













4.2.1 – الآفاق : 
تشهد برامج البحث الآلية تطوراً كبيراً في بنيتها ، ويزداد اعتمادها على الذكاء الصنعي ، ويحاول مصمموها باستمرار سد الثغرات التي أشرنا إليها سابقاً، لأن الوسائل الراهنة المتوافرة للبحث عن المعلومات عبر الشبكة لن تكون قادرة على مواجهة معدل النمو المتسارع جداً . 
ورغم كل ذلك فإن الاتجاه الرئيس في هذا المجال لن يتقرر فقط في مكاتب التقنيين والباحثين وإنما سيقرره الجمهور الواسع في إنترنت . 
إن توسع نطاق أي من مهارات التصنيف البشرية أو الفهرسة الآلية واستراتيجيات البحث الضرورية سيتوقف على الناس الذين يستخدمون إنترنت ، فهناك مجموعات كبيرة من الباحثين الذين يرغبون بدعم مهارات التصنيف البشرية ويرون أن أفضل نموذج للإنترنت هو المكتبة الرقمية ، في هذه الحالة لا تبقى محركات البحث مجانية لأن مشتركي إنترنت سيتضاعفون بنسبة كبيرة حسب توقعات المراقبين جميعهم ، بينما هنالك مجموعات أخرى ترغب بالحصول على المعلومات على أوسع نطاق وهذا ما توفره الفهرسة الآلية ، وكذلك يرغب المحللون الاقتصاديون بالحصول على نفاذ شامل إلى قواعد البيانات الخام للمعلومات دون أي تحكم أو رقابة أو تنقيح ، وهم بذلك يرون في محركات البحث ضالتهم المنشودة لأنها توفر لهم فوائد حقيقية فهي تمنع أي ترشيح Filtering انتقائي للمعلومات . كما يحتاج عدد كبير من المستخدمين إلى إرشادات حول الطريقة المثلى لاستخدام إنترنت والحصول على المعلومات التي تتعلق بعملهم أو بهواياتهم دون أن يضطروا إلى دفع نفقات المفهرسين البشر لتحليل ونقد عشرات آلاف المواقع في إنترنت . 
ولذلك نستطيع القول إن قرار اختيار منهج معين لتجميع المعلومات سيتوقف غالباً على المستخدمين . هل يناسبهم أسلوب منظم لبناء المجموعات ؟ أو يفضلون أن تبقى فوضوية ، مع توفير النفاذ بالنظم الآلية ؟ . 
وتتوقع بعض الأوساط أن تكون الخدمات الجديدة لمحركات البحث موجهة إلى قطاعات متخصصة ومتنوعة مثل محركات بحث مصممة للفنون الإبداعية وأخرى للآداب أو للعلوم الإنسانية أو آليات السيارات أو حتى لمبرمجي الحاسوب. 
وبما أن خيار دعم الفهرسة البشرية سيتكلف مبالغ كبيرة جداً لتحقيقه ، فقد تكون الفهرسة الآلية منخفضة الكلفة التي تعتمد على الحاسوب هي المهيمنة في المستقبل على البيئة عديمة الشكل التي تميز إنترنت المعاصرة . 
لذلك نجد أن صياغة مستقبل استرجاع المعلومات في إنترنت سيعتمد على العوامل الاجتماعية والاقتصادية أكثر من اعتماده على إمكانات التطور التقني . 
وبناء على ذلك قد تتجه إنترنت في النهاية إلى الانقسام إلى شبكتين ، إذ تعتزم المؤسسات العلمية الأمريكية تحقيق تصورها حول إنشاء شبكة ( إنترنت 2 ) وشبكة إنترنت الجيل التالي Next Generation Internet (NGI) حيث يفترض أن تخصص هاتان الشبكتان للبحث العلمي ، وبذلك يمكن أن تكونا أكثر تأهيلاً لتطبيق حلول تدمج جهات المكتبيين مع قدرات برامج الفهرسة الآلية للوصول إلى تنظيم أدق المعلومات المنشورة على الشبكة .
























المراجع


1- Chapman. Fern Shumer : Web of Deceit-Pc WOLD, August / 1997 
2- Engst, Tonya: The Internet Robot’s Guide to a Web Site-Byte, May / 1997 . 
3- Fox, Robert: Communication of the ACM- Web Techniques, January / 1997.
4- Halfhill, Tom. R.: Good-Bye, GUI….Hello,NUI-BYTE/ 1997 .
5- Lange, Alex: Sorting through Search Engines – Web Techniques, June / 1997 .
6- Lynch, Clifford : Searching the Internet Scientific American, March / 1997. 
7- Richardson, Eric.c: See; Seek and Shalbe Found – Web Developer, November/ December / 1996 .
8- Scientific American : Feltering Information on the Internet – March / 1997 . 
9- Scientific American : The Internet : Bringig Order from Chaos- March / 1997 . 

المصدر: م/تامر الملاح
tamer2011-com

م/تامر الملاح: أقوى نقطة ضعف لدينا هي يأسنا من إعادة المحاولة، الطريقة الوحيدة للنجاح هي المحاولة المرة تلو المرة .."إديسون"

  • Currently 15/5 Stars.
  • 1 2 3 4 5
5 تصويتات / 9198 مشاهدة
نشرت فى 21 إبريل 2011 بواسطة tamer2011-com

ساحة النقاش

م/ تامر الملاح

tamer2011-com
باحث فى مجال تكنولوجيا التعليم - والتطور التكنولوجى المعاصر »

ابحث

تسجيل الدخول

عدد زيارات الموقع

3,917,349

بالـعلــم تـحـلـــو الحـــيـاة

للتواصل مع إدارة الموقع عبر الطرق الأتية:

 

 عبر البريد الإلكتروني:

[email protected] (الأساسي)

[email protected]

 عبر الفيس بوك:  

إضغط هنا

(إني أحبكم في الله)


أصبر قليلاً فبعد العسر تيسير وكل أمر له وقت وتدبير.