1- مشكلة الدراسة وأهميتها
1. مشكلة الدراسة:(واقع البحث في الشبكة العنكبوتية)
باتت مصادر المعلومات الإلكترونية وعلى رأسها صفحات الشبكة العنكبوتية في العقود الأخيرة السالفة, المضخة الأساسية لما عرف بثورة المعلومات في وقتنا الراهن (بلغ عدد صفحات الويب ابريل 2009 مايقارب 90بليون صفحة بتنوع فئاتها ولغاتها وبلغ عدد خوادمها من الحاسبات 171 مليون خادم ليخدم نحو بليون مستخدم حول العالم[2]), والتي بدورها أرست ربوع ظاهرة تفجر المعلومات, ويعد أحد أهم الوسائل التي اتخذها المعلوماتيون لضبط الأشكال المختلفة لمصادر المعلومات الإلكترونية, هي ادوات البحث على شبكة الانترنت والمتمثلة في الأدلة الموضوعية ومحركات البحث وماوراء محركات البحث والبوابات العامة والمتخصصة والوكائل الذكية والفهارس الرقمية وفهارس الويب غير المرئي ومحركات البحث المتخصصة وغيرها من وسائل اختزان واسترجاع المعلومات , والتي يمكن القول بأن صفحات الشبكة العنكبوتية لن يمكن الوصول اليها بفاعلية ويسر بدون وجود مثل هذه الأدوات.
وتأتي على رأس هذه الأدوات محركات البحث ,والتي تنبع أهميتها من كونها أحد أشكال نظم استرجاع المعلومات كاملة النص والتحقيق.
أهداف الدراسة:
تسعى الدراسة بشكل مباشر إلى تحقيق الأهداف التالية:
1. التأصيل النظري لظاهرة الشبكة العنكبوتية الدلالية حيث تعد هذه الدراسة هي أول دراسة عربية أكاديمية تتطرق لهذه الظاهرة في مجال المكتبات وعلم المعلومات.
2. التعرف بشكل تفصيلي على البنية الدلالية للشبكة العنكبوتية وأضلاعه الأساسية التي تتمثل في:
· XML (Extensible Markup Language).
· RDF (RESOURCE DESCRIBE FRAMEWORK).
· OWL (ONTOLOGY WEB LANGUAGE).
تساؤلات الدراسة:
تسعى هذه الدراسة من واقع الأهداف التي ارتضاها الباحث لموضوعة عن الإجابة عن التساؤلات الآتية:
1. ما هي شبكة الويب الدلالية , وما هي مكوناتها والتقنيات المختلفة التي تدعم بنيانها ؟
2. ما هو واقع اللغة العربية الشبكة العنكبوتية الحالية؟
3. ما هي التحديات التي تواجه الشبكة العنكبوتية الدلالية؟
أهمية الدراسة:
تاتي اهمية هذة الدراسة في كونها دراسة مهادية تاصيلية لظاهرة الويب الدلالي في مجال المكتبات والمعلومات وبها يجدر بنا الإشارة إلى هذا الحدث الجلل الذي يصحب في طيات تلابيبه ما قد يمكن القول عليه بالعصا السحري لحل مشاكل الشبكة العنكبوتية الحالية , هذا الحدث يتمثل في تقنيات واليات نشأت وترعرعت في طيات ما عرف بالشبكة العنكبوتية الدلالية Semantic Web. وفي السطور القادمة نسعى إلى هوية الكيان البنائي والوظيفي للشبكة العنكبوتية الدلالية.
الدراسات السابقة :
ظهرت اولى الدراسات العربية حول الشبكة العنكبوتية العالمية والتي أعدها أبو الحجاج محمد بشير([3]) وقد تناول فيها مفهوم شبكة الويب الدلالية ومكوناتها ومحتواها ثم تناول محركات البحث في هذه الشبكة الجديدة وما ستتمتع به من قدرات في البحث والاسترجاع , ويجدر الإشارة إلى أن الدراسة التي أعدها أحمد بدر([4]) قد تناولت أحد القطاعات التكوينية في بنية الشبكة العنكبوتية الدلالية والتي تمثلت في تناول مفهوم الانطولوجيا في علم المعلومات وقدرة فيكري في الاستفادة من هذه التقنية في التحليل الموضوعي, كذلك تناولت هبة عبد الستار([5]) أحد الجوانب التكوينية الأخرى لبنية الشبكة العنكبوتية الدلالية وهي لغة التكويد الموسعة وأوجه الإفادة منها في التشغيل التبادلي قدراتها على تمثيل المصطلحات والعلاقات التي تربط بينها.
وتعد الدراسات الأجنبية في هذا الجانب هي أغزر وأوفر وقد تمثلت أولى هذه الدراسات في الدراسة التي أعدها تيم بيرنرز لي وجيم هندلر (Tim Berners-Lee, Jim Hendler)([6]) والتي تمثل أول دراسة عالمية أعدت حول هذا الموضوع بل هي أول دراسة استهلالية حول موضوع شبكة الويب الدلالية و التي أعلن فيها تيم بيرنرز لي ظهور شبكة الويب الدلالية موضحا الهدف منها ومحتواها وملامح اختلافها عن شبكة الويب التقليدية , وتقدم هذه المقالة مقابلة شخصية مع تيم بيرنيرز لي مخترع شبكة الويب الدلالية , ثم أوضح لي [7]في حديث صحفي له أن الهدف من هذا المشروع يتمثل في جعل بنية الشبكة العنكبوتية أيسر في البحث عن المعلومات ثم أتبع قوله بمقارنه هذا الجيل الجديد من الويب وما يحمله من خدمات في مقابل الخدمات المتاحة حاليا , ثم استطرف عن مقارنة محركات البحث الدلالية بمحرك جوجل , وتعد دراسة جولد سكيمدت (Goldschmidt) ([8] )من أشد الدراسات قربا من موضوع الدراسة حيث هدفت إلى توضيح أن ما تعاني منه محركات البحث التقليدية من مشكلات بحثية قد أوجد لها تيم بيرنيرز لي حلا متمثلا في الويب الدلالي ثم يتطرق إلى توضيح الفارق بين محركات البحث الدلالية ومحركات البحث الدلالية , ويجدر ذكر الدراسة التي أعدها كوين لي([9]) والتي تناول فيها التعرف على الأنطولوجيات المختلفة في بيئة شبكة الويب الدلالية , التعرف على نماذج البيانات المختلفة وأطر وصف مصادر المعلومات لمواجهة المشكلات التي تعانيها محركات البحث التقليدية , أما دراسة لي دنج([10]) فقد هدفت إلى التعرف على إمكانيات البحث داخل محركات البحث الدلالية , أمكانيات التشغيل المتبادل بناءا على مكونات الشبكة الدلالية وان لغات تكويد الصفحات ستعتمد في المقام الأول على الإطار العام لوصف المصادر.
منهج الدراسة
تعتمد هذه الدراسة على المنهج الوصفي التحليلي لوصف ورصد الشبكة العنكبوتية الدلالية على مستوى العالم ووفقا لمجال الدراسة التي ارتضاها الباحث لنفسه
التمهيد:
تفوقت محركات البحث على نظائرها من ادوات البحث بحجم قواعد بياناتها في ظل اعتمادها على التقنيات الالية في التجميع والضبط والتكشيف والاتاحة والترتيب, فضلا عن استخدامها من قبل ما يقرب من 85% من مستخدمي الشبكة العنكبوتية[11], وبعدما أصبحت محركات البحث جزءاُ من حضارتنا المعلوماتية, تعاني بدورها مما تعاني منه نظم استرجاع المعلومات من نقص في التغطية المطلوبة وافتقار للدقة المنشودة, فقد اوضحت احدى الدراسات ان نسبة تغطية محركات البحث للمحتوى المتاح على الشبكة العنكبوتية بلغ ما يقرب من 20% وان رضا المستفيدين تجاه تلبية محركات البحث لاحتياجاتهم المعلوماتية تبلغ 40%([12]) , فضلاُ عن بعض المشاكل المتفاقمة التي تؤود بمحركات البحث عن تحقيق مهمتها ,والمرتبطة بكينونة الكيان العنكبوتي للإنترنت وتعد أهم المشاكل التي تعاني منها:
1/1- نمو الشبكة العنكبوتية أسرع كثيرا مما قد يستطيع أي محرك بحث مهما توافرت له من تقنيات حصده وفهرسته أن تلاحق هذا الفيض الهائل من مصادر المعلومات, فضلا عن هذا النمو تتفاقم مشكلة التباين والتعدد في الموضوعات واللغات والشكل والجودة.
1/2- الزيارات المستمرة التي تقوم بها زواحف المحركات لتجميع وضبط المواقع وذلك في ظل تحديث صفحات الويب ورغم ذلك تعد قدرتها على تغطية ما هو متاح على الشبكة ضئيل جدا وان أي من هذه المحركات لا تغطي منفردة أكثر من 30% ([13]) من صفحات الويب القابلة للتكشيف.
1/3- عمليات البحث طلبا للمعلومات التي يقوم بها المستفيد محصورة حاليا على البحث في الكلمات المفتاحية، والتي قد تتسبب في الكثير من نتائج إيجابية زائفة .
1/4- المواقع المولّدة آليا (الدينامكية) تتسم بالخروج عن السيطرة من جيث التجميع والالتقاط لها.
1/5- الكثير من المواقع المولّدة آليا (الدينامكية) غير قابلة للفهرسة بواسطة محركات البحث؛ وهذه الظاهرة تعرف باسم ’الشبكة غير المرئية‘.
1/6- بعض محركات البحث لا تربط النتائج بمدى الصلة، وإنما بحسب كم دفعت لها المواقع من الأموال لحصولها على درجة عليا في الترتيب ( (rankingوغير ذلك من الوسائل التي أدت إلى تفاقم ظاهرة عدم مصداقية محركات البحث.
1/7- بعض المواقع تصنع خدعا للتلاعب بمحرك البحث ليعرضها في النتائج الأولى كالرد على بعض الكلمات المفتاحية. وربما يؤدي هذا لتلوث بعض نتائج البحث، مع تأخر الروابط الأقوى صلة في ترتيب قائمة النتائج.
1/8- ثبوت فشل النظم المقيدة في بناء محركات البحث, فضلا عن سوء التقدير التي تعاني منه النظم ذات البنية الحرة, وإن كان الجمع بينهما تحت ما عرف بالنظام الهجين لا يخلو بدوره من العيوب والتي تناولتها أحد الدراسات والتي توضح أن من أبرز عيوبها أن المزج بين عناصر الموضوع من مقيد وحر في ألفاظه يحقق استرجاعا عاليا ولكن لا يحقق ملائمة مع احتياجات المستفيدين([14]) ,فكل ما هو هجين عقيم.
ولا تعد هذه المشكلات حصرا لما تواجهه محركات البحث من جوانب قصور بل هي أهم ما تواجهه هذه المحركات.
فضلا عن مشاكل تقنيات البحث والتي تتمثل في:
· تأكيد خبراء المعلومات أن المستخدمين نادرا ما يقومون بطرح الأسئلة التي تعبر عما يريدونه فعلا, والسبب الرئيسي في ذلك هو الافتقار إلى الفهم الصحيح للموضوع قيد البحث فالمستفيدون يميلون الى تقديم استفسارات اعم بكثير من الحاجة الفعلية الى المعلومات[15].
· العلاقة العكسية بين الاستدعاء والتحقيق.
· معظم الكلمات تحمل أكثر من معنى، والسواد الاعظم من محركات البحث المستخدمة اليوم تقوم بمطابقة الكلمات وليس معانيها ودلالاتها، ولذلك فإن نتائج عمليات البحث التي نحصل عليها، تحتوي غالبا على الكلمات المفتاحية الصحيحة، ولكنها ذات المعنى الخاطئ.
· افتقار المواقع العربية إلى التكشيف الدقيق في محركات البحث العالمية بل نؤكد ظلم هذه المواقع في ظل البنية اللغوية الخاصة باللغة العربية وصعوبة تعامل برمجيات هذه المحركات مع هذه البنية.
· وقد اوضحت احدى الدراسات ان مشكلات محركات تكمن في مجموعة من العناصر وهي:
1. الحاجة الى فهم البنية التركيبية البيانية (web graph)للشبكة العنكبوتية مما قد يسهم بشكل اكثر كفاءة في حصد وتجميع المواقع والصفحات على الشبكة العنكبوتية.
2. الفهم الجيد للخصائص المتنوعة للصفحات الشبكة العنكبوتية فضلا عن الحاجة لدراسة المعدل الزمني للتغير بينة المواقع وخصائصها .
3. العمل على توفير منهجية فعالة في لتجنب ازدواجية المضيفين مما يساعد الزاحف على تجنب تجميع نفس الصفحة التي جمعت من قبل[16].
وفي دراسة اخرى اوضحت ان محركات البحث تعاني من تحديات قوية ياتي على راسها:
· الحفاظ على كشاف محرك البحث بشكل محدث ونشط ومكتمل مما يضمن اشتماله على التغيرات التي تطرا على البيئة العنكبوتية.
· تحديد وازالة المحتوى المخادع والروابط الزائفة وتنقية محركات البحث من هذة المشكلات.
· تحديد درجة الموثوقية في محتوى المواقع فالشبكة العنكبوتية مليئة بمحتوى متباين ومتناقض وذو جودة منخفضة من حيث التركيب والدلالة .
· استغلال التغذية المرتدة من قبل المستفيدين تجاه المعلومات المقدمة.
· اكتشاف ازدواجية المضيفين لتجنب التجميع المكرر.
· اكتشاف سلوك المستفيد من حيث (الحاجة للمعلومات – والملاحة والاكتشاف).
· تحسين لغة وصيغ الاستفسار من حيث مراعاة السياق المعرفي للاستفسار من حيث النوع والوقت والسياق الدلالي للاستفسار .
· تحسين الترتيب الطبقي بجعله يعتمد على سمات المستفسر او المستفيد[17].
فالمرجعية في هذه المشكلات إلى أحد أهم الزوايا التكوينية للشبكة العنكبوتية والتي تتمثل في
اتساع الفجوة بين الجانبين الأساس للشبكة العنكبوتية المتمثلان في:
1. المحتوى: وهو المضمون الذي تشمله صفحات المعلومات على الشبكة العنكبوتية.
2. البرامج: المتمثلة في البروتوكولات ولغات البرمجة والتكويد.
وبالاحرى افتقار البرامج لمعالجة المحتوى.
فهما يفتقران إلى التكامل لنيسجا معا نسيج الشبكة العنكبوتية.
وفي هذا السياق ستستعرض هذة الورقة البحثية مشكلات بنية الشبكة العنكبوتية وفقا للفلسفة التكوينية الوظيفية لنظام استرجاع المعلومات.
بالنظر الى فلسفة التكوين الوظيفي لنظم استرجاع المعلومات نجد انه كسائر النظم الاخرى له مدخلاته وعملياته ومخرجاته وبيئة تؤثر فيه ويتاثر بها والسؤال الذي يطرح نفسة في هذا السياق ماهي مدخلات الشبكة العنكبوتية ؟
تتمثل مدخلات الشبكة العنكبوتية في عنصرين:
1. الوثائق (مصادر المعلومات الالكترونية - المواقع)
2. الاستفسارات (عناوين محددات مصادر المواقع URLs).
بمراجعة ادبيات الانتاج الفكري العربي اتضح افتقار المكتبة العربية للدراسات حول طبيعة مواقع الشبكة العنكبوتية وان كانت تناولت بعض الدراسات تقييم المواقع وفقا لخصائصها الوظيفية دون النظر الى بنيتها التكوينية .
المواقع العنكبوتية The Web Sites:
لم تولي العديد من الدراسات العربية التي صدرت في مجال الشبكة العنكبوتية اهتماما بمدخلات الثانية وطبيعتها في ظل بيئة ديناميكية متغيرة كبيئة الشبكة العنكبوتية ناظرة في ذلك ان اغلب مشكلات نابعة من قصور في الخدمات البحثية التي تكفلها الشبكة العنكبوتية وكينونتها وخوارزمياتها وليس نابعا من طبيعة الوثائق التي تحملها الشبكة وتعالجها مما يقف امامها بمثابة تحديا تعمل على مواجهته وتسعى للتغلب علية, انحصرت اغلب الدراسات التي تتعلق بمدخلات محركات البحث (الوثائق والمواقع) حول تهيئة المواقع لمحركات البحث او ما عرف بSEO(search engines optimization) او رفع اداء محركات البحث ومفهومها يقتصر في ادراج مجموعة من اكواد الميتاداتا داخل بنية الوثيقة لتحسين رتبتها في نتائج البحث دون النظر الى التكامل الموضوعي حتى بداخل الوثيقة نفسها.
ما يعنينا في هذا السياق المعلوماتي للوثائق المحاور الاتية:
1. تكويد الوثائق.
2. البنيه اللغوية.
1. تكويد الوثائق:
بادئ ذي بدء يقع عاتق هذا المحور على منشئ الوثائق ففي ظل ماتتمتع به الشبكة العنكبوتية من حرية وديموقراطية في التاليف والنشر دون قيد فكري او لغوي او بنائي, اختلط في هذة الشبكة الغث الثمين من حيث البناء والتركيب في الشكل واستتبع ذلك ممارسات مشهورة في الاعتماد على برامج تحرير المواقع ونظما لادراة المحتوى اثبتت جودتها في العرض وحملت في باطنها العقم والعجز في ان تفهم ما تعرضه ودلالات ما تبحث عنه, بلغت نسبة المواقع التي تدخل في بنيتها التكويدية لغات MARKUP LANGUAGRE نحو 96% من اجمالي الشبكة العنكبوتية وينظر البعض الى ان لغات MARKUPقد جمعت بين مزايا الملفات النصية والثنائية *من حيث السرعة في الفهم من قبل الحاسب والتوافقية بين التطبيقات المختلفة والسهولة في تهيئة النص, والحقيقة ان هذة الفكرة ليست بالجديدة فمنذ توافر الحاسب امام المبرمجين وهم يعملون بدأب على ايجاد طريقة لتبادل المعلومات بين مختلف الانظمة والبرامج والتطبيقات وفي ذلك كانت بواكير هذة اللغة متمثلة في لغةSGML(standard generalized markup language)وهي لغة نصية تستخدم لترميز البيانات ولكن بطريقة تشرح نفسها بنفسها وهو ما يعرف باللغات ذاتية الوصف (self describing) ولكن اتضح فيما بعد انها معقدة الى اقصى درجة في ظل اعتمادها على ذاتيتها الوصفية ومنها تمخضت لغة اخرى لتنبثق عام 1994 على يد تيم بيرنرز لي لغة HTML(hyper text markup language)اعلن السيد تيم بيرنرز لي في لقاء له ان الغرض منها في البداية هو توفير القدرة للتطبيقات الحاسب على عرض المحتوى دون اللارتباط بنظام محدد او تطبيق خاص ساعيا بذلك نحو التكاملية في المعلومات بين الانظمة[18] وفي هذا السياق بلغت عدد المواقع المكودة بلغة htmlنحو 85% ورغم ذلك لم تحقق هدف التكامل في المعلومات وان كانت قد قامت بوظيفة عرض البيانات على اكمل وجه في ظل ماتتمتع به هذة اللغة من بثبات في بنيتها التكويدية.
اثبتت احدى الدراسات ان 80% من محتوى الويب الحالي عبارة عن نصوص صممت لكي يقرأها ويفهمها البشر بينما برامج الحاسب ومتصفحات الويب وبرامج البحث عاجزة عن التعامل مع هذا المحتوى وفهمه وتحليله بناءا على دلالته او مضمونه[19] ولعل المرجعية في ذلك الى افتقار لغة html الى دلالة ومعنى ومضمون ما تعرضه.
والتي يعد من أبرز عيوبها:
1.أنها بمثابة كتلة من البيانات غير الموصوفة حيث لا توفر هذه اللغة توصيف للمحتوى, فهي تمثيل أصم للبيانات.
2.تعد هذه اللغة بمثابة عالم فوضوي من الروابط الصماء والتي لا تعني للآلة إلا جملة "هذا الموقع مرتبط مع هذا الموقع" فقط من دون أن تحمل هذه الجملة أي دلالة لفظية كأن يشير الرابط إلى أن الموقع مرتبط بآخر بعلاقة "هو نوع من" أو "جزء من" وغيرها من العلاقات الوصفية ( رغم ذلك تعتمد أقوى محركات البحث على هذا العنصر في بناء خوارزمياتها وترتيب نتائجها للمستفيد وتحديد علاقات البنوة و الأبوة للوثائق ومن أشهر هذه المحركات جوجل) .
3.ومن أهم مواطن الضعف هو ضعفها عن توفير قدرة التشابك في البيانات في ظل التطوير البرمجي المستقل للبرامج.
4.ورغم ذلك أوضحت إحدى الدراسات أن ([20]) 85% من صفحات المعلومات المنشورة على الشبكة يتم تمثيلها بهذه اللغة.
وفي ظل ذلك تقف لغة HTMLعقبة عسيرة في تحليل مضمون الوثائق من قبل زواحف محركات البحث وما يستتبع من مشكلات ومواطن ضعف .
5.عجزها النسبي عن القيام بتمثيل محتوى ذو طبيعة خاصة كالنوت الموسيقية او مجموعة من المعادلات الرياضية.
وبالتالي فان الشبكة العنكبوتية الحالية مهما كانت تعمل على تطوير قدراتها في البحث الذكي عن المعلومات وتحليلها فانها محدودة في النهاية بقيود البحث الشكلي وفقا لطبيعة تكويد محتوى الوثائق فمازالت ادوات البحث تعتمد على استرجاع الصفحات والمواقع التي وردت فيها الكلمات او عبارات معينة دون فهم لمضمون المواقع دون الربط بين المواقع الشبيهة ولنا مثال في ذلك: فلو هناك موقع يتحدث عن الموسيقار بيتهوفن من حيث الجانب التاريخي والسيرة الذاتية وموقع اخر يعرض مقطوعات وتسجيلات بيتهوفن للبيع وموقع اخر يعرض صورة بيتهوفن الموجودة داخل متحف الموسيقى بالنمسا وموقع اخر يعرض الاحداث التاريخية والسياسية والاجتماعية في نفس الفترة الزمنية التي عاش فيها بيتهوفن, وفقا للبنية الوصفية والشكلية للمواقع في ظل الاعتماد على لغة html فان ادوات البحث ستنظر لكل هذة المواقع على انها مفردة كل على حدى دون وجود اي ارتباط موضوعي بها , في حين من الممكن ان يتوافر من واقع هذة المصادر بنية معلوماتية متكاملة تفيد كل من يبحث عن بيتهوفن بسؤال واحد او استفسار واحد, وهو ما يسعى الويب الدلالي الى تقديمة.
2. البنية اللغوية:
في عالم الانترنت المحتوى هو الملك The content is a kingفبدون محتوى تصبح الشبكة العنكبوتية بتقنياتها وبروتكولاتها وبرامجها كالانابيب الفارغة دون ماء فيها, وتسهم اللغة بشكل اساسي في تشكيل المحتوى وبشكل خاص هناك مقولة تقول ان من يستطيع ان يسوق لغته يستطيع ان يسوق منتجه في عصر اقتصاد المعرفة وتعتبر اللغة ومعالجتها اليا احد اهم عناصر البنى الاساس التي يقوم عليها صناعة المحتوى وتشمل صناعة المحتوى كل ماينتجه النشر الالكتروني من مواقع ووثائق وملفات ذات وسائط متعددة(في ظل التعبير عنها وتكشيفها في سياق لغوي) اما عن واقع اللغة العربية على الانترنت فيتمثل في حجم المحتوى العربي المتاح على الشبكة العنكبوتية بنسبة 0.2% من حجم المحتوى المتاح على الانترنت بواقع 100 مليون صفحة في حين يبلغ عدد مستخدمي الانترنت في الوطن العربي ما يقرب من 40 مليون نسمة حتى عام 2008 65% من المستخدمين العرب يعتمدون على اللغة العربية في البحث والتصفح وفي الشكل رقم 1 تظهر احصائيات حول مستخدمي الانترنت في الوطن العربي اما عن معدل النفاذ الى الانترنت في الوطن العربي فقد بلغ نحو 17.4%من اجمالي نسبة النفاذ في العالم[21].
وفي هذا السياق اوضح هيرمان هيفرمان انه لا يوجد حتى الان محرك بحث عربي خالص القوام وفقا لمفهوم ورؤية محركات البحث, وماهو متاح في الاسواق مما تدعي على انفسها محركات للبحث هي ادلة بحث لا يعتمد على البحث في قاعدة بيانات خالصة له[22].
تعد اللغة العربية اقدم اللغات على مستوى العالم وسادس لغة معترف بها على مستوى الامم المتحدة وهي اعقد اللغات السامية واغناها صوتا وصرفا ومعجما وقد اوضح نبيل علي خصائص اللغة العربية من منظور المعالجة الالية المعلوماتية لها موضحا كينونتها بانها تمتاز:
1. - التوسط اللغوي.
2. - حدة الخاصية الصرفية.
3. - المرونة النحوية.
4. - الانتظام الصوتي.
5. - ظاهرة الإعراب.
6. - الحساسية السياقية.
7. - تعدد طرق الكتابة وغياب عناصر التشكيل.
8. - ثراء المعجم واعتماده على الجذور.
9. - شدة التماسك بين عناصر المنظومة اللغوية.[23]
وفي هذا أثبتت اللغة العربية أيضا جدارتها كلغة عالمية فبفضل توسطها اللغوي الذي أشرنا إليه أعلاه يسهل تطويع النماذج البرمجية المصممة للغة العربية لتلبية مطالب اللغات الأخرى وعلى رأسها الإنجليزية. بقول آخر فإن العربية لغويا وحاسوبيا يمكن النظر إليها بلغة الرياضيات الحديثة على أنها فئة عليا supersetتتدرج في إطارها كثير من اللغات الأخرى كحالة خاصة من هذه الفئة العليا[24].
الدولة |
عدد السكان |
عدد مستخدمي الانترنت عام 2000 |
عدد مستخدمي الانترنت عام 2008 |
الاجمالي |
معدل ارتفاع نسبة الاستخدام |
نسبة النفاذ على الانترنت |
الجزائر |
33,769,669 |
50,000 |
3,500,000 |
9.13% |
6900% |
10.4% |
البحرين |
718,306 |
40,000 |
250,000 |
0.65% |
525% |
34.8% |
جزر القمر |
731,775 |
1,500 |
21,000 |
0.05% |
1300% |
2.9% |
جيبوتي |
506,221 |
1,400 |
11,000 |
0.03% |
686% |
2.2% |
مصر |
81,713,517 |
450,000 |
8,620,000 |
22.48% |
1816% |
10.5% |
العراق |
28,221,181 |
12,500 |
54,000 |
0.14% |
332% |
0.2% |
الاردن |
6,198,677 |
127,300 |
1,126,700 |
2.94% |
785% |
18.2% |
الكويت |
2,596,799 |
150,000 |
900,000 |
2.35% |
500% |
34.7% |
لبنان |
3,971,941 |
300,000 |
950,000 |
2.48% |
217% |
23.9% |
ليبيا |
6,173,579 |
10,000 |
260,000 |
0.68% |
2500% |
4.2% |
موريتانيا |
3,364,940 |
5,000 |
30,000 |
0.08% |
500% |
0.9% |
المغرب |
34,343,219 |
100,000 |
7,300,000 |
19.04% |
7200% |
21.3% |
عمان |
3,311,640 |
90,000 |
300,000 |
0.78% |
233% |
9.1% |
فلسطين |
2,611,904 |
35,000 |
355,000 |
0.93% |
914% |
13.6% |
قطر |
928,635 |
30,000 |
351,000 |
0.92% |
1070% |
37.8% |
المملكة العربية السعودية |
28,161,417 |
200,000 |
6,200,000 |
16.17% |
3000% |
22.0% |
الصومال |
9,558,666 |
200 |
98,000 |
0.26% |
48900% |
1.0% |
السودان |
40,218,455 |
30,000 |
1,500,000 |
3.91% |
4900% |
3.7% |
سوريا |
19,747,586 |
30,000 |
2,132,000 |
5.56% |
7007% |
10.8% |
تونس |
10,383,577 |
100,000 |
1,765,430 |
4.60% |
1665% |
17.0% |
الامارات |
4,621,399 |
735,000 |
2,300,000 |
6.00% |
213% |
49.8% |
اليمن |
23,013,376 |
15,000 |
320,000 |
0.83% |
2033% |
1.4% |
المجموع |
344,866,479 |
2,512,900 |
38,344,130 |
100.00% |
1426% |
11.1% |
جدول (1) يوضح واقع الهوية المعلوماتية العربية على الانترنت[25]
واوضح HAIDAR MOUKDADANDANDREW[26]LARGEمجموعة من مشكلات للغة العربية وهي:
1. اشتمال الكلمات العربية على بعض السوابق مثل اداة التعريف ال وعدد اخر من السوابق كحروف الجر والتي لاتاتي بشكل منفصل عن البينية التركيبية للكلمة مما يؤدي الى ان ترتب هذة الكلمات وفقا لسوابقها في الكشاف.
2. التركيب الصرفي للكلمات في اللغة العربية.
3. احرف العلة في اللغة العربية.
4. رد الكلمة لجذورها او مادتها اللغوية للبحث عنها.
5. مشكلات اختلاف البنية الصرفية للكلمة في حالة التانيث والتذكير والجمع والمثنى.
6. مشكلة الشدة والحرف المزدوج.
سبق وقد اوضح الباحث ان مدخلات محركات البحث (الوثائق المكشفة)يقع على عاتقها اكبر الاثر عجز محركات البحث في تقديم نتائج ذات دقة وفي هذا المضمار يسعى الويب الدلالي الى تحسين المدخلات المتمثلة في انشاء المواقع وتهيئتها لمحركات البحث وقد سبق واوضح الباحث ان اقصى اشكال التهيئة التي يوفرها منشئ ومصصمي المواقع تتمثل في SEO.
جدول يوضح واقع اللغة العربية على الانترنت[27]
2/1 - الشبكة العنكبوتية الدلالية:
2/1/1- تاريخها
"هي امتداد للشبكة العنكبوتية العالمية بصورتها الحالية"[28] هكذا عرفها تيم بيرنيرز لي صاحب رؤية الويب الدلالي وفي هذا السياق يجدر الاشارة الى تاريخ الشبكة العنكبوتية بمختلف مراحلها .كانت بواكير ظهورالشبكة العنكبوتية في اوائل الثمانينات وبالتحديد في ديسمبر 1980 ,حيث قدم تيم بيرنرلي برنامجا يعرف ب "Enquire-Within-Upon-Everything",والذي يسمح بالربط بين الملفات بشكل اعتباطي في ظل ان لكل ملف هوية وخصائص تميزة عن غيره, ثم تلي ذلك تقديم ورقة بحثية حول الغرض من ادارة المعلومات من قبل تيم لي لقياس مردود النص الفائق في معامل سيرن، وفي عام1989 قدم تيم بيرنرز لي مشروع لغة تعليم النص المترابط والذي عرففيما بعد بالشبكة العالمية World Wide Webمعتمداً على برنامج Enquire، وقد صمم لربط وتكامل المعرفي بين المستخدمين , وفي عام 1990 اعطى مدير معامل سيرن الضوء الاخضر لتيم لي بان يقوم باتاحة النص الفائق على الانترنت ,كما كان تيم هو أولمنقدم برنامج مستقل لتصفح إلانترنت وفي عام 1994 اصبحت الشبكة العنكبوتية متاحة للجميع .
امتازت الشبكة العنكبوتية كمنصة عمل على الانترنت عن غيرها من منصات العمل الاخرى مثل(جوفر – والتلنت) وغيرها بمجموعة من العناصرهي:
1. البساطة في معماريتها- حيث الاعتماد على النص الفائق الذي يمتاز بالسهولة واليسر في التحرير,وبروتكول النص الفائق الذي يعمل بتوافقية شديدة مع البروتكولات الاخرى مثل (بروتكولSTMP), فضلا عن الاعتماد على محدد المواقع URLs.
2. التشبيك: حيث النمو الشبكي المرن في المحتوى والخدمات.
3. القابلية في التوسع:بداية من ويب الوثائق حتى ويب الوسائط المتعددة والويب الدلالي.
4. العالمية: في ظل الاعتماد على نسق وانظمة متباينة ووتعددية في لغات محتواها.
5. التكلفة: حيث انخفاض تكلفة التشغيل من متصفحات مجانية وخدمات واتصال بالانترنت.
6. التنوع الفكري: في ظل اشتمالها على اغراض متعددة من تثقيف وترفيه وتعليم .
وقد افضت هذة المزايا وغيرها الي ما يعرف بظهور اجيال الويب.
اجيال الويب:
في نهاية عام 2006 وردت في مجلة التايم الامريكية ان شخصية العام هي انت ,معلنة بذلك ان المستفيد اصبح الان محور الشبكة العنكبوتية,مثبتتة بذلك الدور الذي لعبه الجيل الثاني من الشبكة العنكبوتية ,وعلى النقيض الاخر اوضح تيم بيرنرزلي – مخترع الويب -في احد اللقاءات التي نشرت على موقع اي بي ام وجهة نظرة قائلا"ان الجيل الاول من الويب عمل بشكل كبيرعلى الربط بين مستخدمي الانترنت في مساحة من التفاعلية وان مصطلح الجيل الثاني مصطلح يتسم بالرنانة لاتتضح سماته لنا فالجيل الثاني ان كان يعني لنا مدونات وتقنية الويكي وقدرات في ان يتواصل الافراد بعضهم البعض, ففي النهاية مازالت المعايير التي ارست منذ اختراع الويب يعمل بها ولم يوفر الجيل الثاني من الويب بتقنياته بنية او معايير اخرى مستحدثة."[29]وفي هذا اعلن لي في هذة العبارة ان ما نحن فيه الان من مسميات رنانة ليس لها واقع ملموس وسيرد فيما بعد المرجعية التي يستند اليها تيم لي في رؤريته .
صك مصطلح الويب 2.0 على يد دالي دفريتي نائب رئيس شركة اوريلي في اثناء التحضيرلاجتماع رسمي مشترك بين شركتي اوريلي وميديا ليف انترناشنوال في عام2004 في الولايات المتحدة معلنا دالي دفرتي "بان الشبكة العنكبوتية الان تشهد تطورا في التقنيات والادوات احدثت انقلابا في اقطاب بنية الويب مفادها ان المستخدم في شبكة الويب هو حاليا محرر الويب"[30].
نشأة فكرة اجيال الويب في رحم ازمة الدوت كوم (فقاعة الدوت كوم) DOTCOMBubble [31]فظهرت الحاجة الى اعادة انعاش سوق الانترنت واسهم المضاربة الخاصة بشركاته فكانت اجيال الويب .
ظهرت مدرستان حول التنظير لفكرة الجيل الثاني للشبكة العنكبوتية:
المدرسة الاولى يتزعمها تيم بيرنرز لي مخترع الويب وترى بانه لايوجد ما يعرف باجيال الويب فلا يوجد اختلاف اساس بين تكنولوجيا الجيل الثاني والجيل الاول فكلاهما يعتمد على تقنية الجيل الاول.
المدرسة الثانية: ويتزعمها تيم اوريلي معلنة بان الشبكة العنكبوتية تشهد تحولا من حيث المحتوى والتقنيات من الضخامة بحيث لاينبغي ان يتجاهل.
يذكر تيم لي بان الويب الدلالي بما يشهدة في تغير في البني التحتية والاساس لنظام الويب ماهو الا امتداد للويب الحالية لان مفادها هو ان تعمل كمنصة عمل للبرامج والتطبيقات فضلا عن جعلها شبكة للمحتوى.
اما المدرسة الثانية فقد قدمت العديد من الدلالات العلمية في هذا الامر من حيث التعريف والهوية والتطبيقات.[32]
اوضح جرهام كرمودبانه مازال هناك جدلا لم يحسم بعد في اوساط المعلوماتيين حول تعريفهم للويب 2.0 فكلما اتسم تعريفها بالشمول زادت سمة المرواغة فمازل من الصعب تبويب المواقع وفقا للجيل الاول والجيل الثاني وليس هناك مثال اوضح من موقع الامازون والذي انشئ في منتصف 1990 والذي عمل على تعديل هيكله كلما توافرت تقنية احدث ,الا انها هناك ما يمكن القول بانه سمات فاصلة وليست حدا واضحا في تقسيم المواقع هذة السمات تتمثل في 3 محاور:
1. المحور التقني الذي مكنت المستفيد التفاعل (حيث الاعتماد على المخططات SCRIPTSمثل تقنية AJAX).
2. المحور البنائي (المتمثل في الغرض وهيكل الموقع).
3. المحور الاجتماعي (مشاركة الاجتماعية بين الاصدقاء والجماعات).
وفي منظور اقتصادي يرى الجيل الاول بانه قد انتهى مع حدوث ازمة فقاعة الدوت كوم حيث افضى بخسارة تقدر 5 تريليون دولار وفي ذلك اطلق على هذا الجيل بانه جيل المحتوى, اما الويب 2.0 فيتمثل في الويب التفاعلي الذي مازال تجني تطبيقاته عائدات مستمرة.
ارجع البعض ان الفترة الزمنية للجيل الاول من الويب تمثلت في 1994 حتى 2004 ومن الجانب التقني ارجع البعض ان الجيل الاول امتاز بالاتصال عن طريق الهاتف dial-up وان سعة bandwidthتبلغ 50 كيلو بايت.
ويرى البعض ان هناك عناصر امتازت بها المواقع ذات الجيل الاول:
1. &nb
ساحة النقاش