مفهوم الاستخلاص : إذا كان التكشيف هو التحليل من اجل أعداد المداخل ومفاتيح الوصول إلى محتوى الوثائق ، فان الاستخلاص هو التحليل من اجل تقديم أهم ما تشتمل عليه الوثائق من رسائل وأفكار ومعلومات . ويعرف ( ألن كنت ) أحد اشهر علماء المعلومات المستخلص بأنه (( الشيء الذي يتكون من ، او يلخص الخصائص الجوهرية لشيء أكبر او عدة أشياء )) . وينص تعريف أخر وهو جزء من معايير المنظمة الدولية للتقييس ( ISO ) أن معنى المصطلح (( مستخلص )) هو (( تمثيل مختصر ودقيق لمحتويات الوثيقة دون تفسير او نقد )) وتؤكد المواصفة العربية الخاصة بالاستخلاص على ضرورة عدم الخلط بين (( المستخلصات )) والمصطلحات ذات العلاقة مثل ( الشرح والمقتطفات والخلاصة ) . (( والشرح )) هو تعليق او توضيح مختصر عن وثيقة ما او محتوياتها او حتى وصف موجز جدا يضاف عادة كملاحظة بعد الوصف الببليوغرافي للوثيقة .

و( المقتطف ) هو جزء او أكثر من وثيقة يتم اختيارها ليمثل الوثيقة ككل . آما ( الخلاصة ) فهي بيان مختصر للوثيقة يكون عادة في نهايتها ويعيد النتائج والاستنتاجات البارزة فيها ويهدف إلى إتمام توعية القارئ الذي قد درس النص السابق . ونظرا لأن الأجزاء الأخرى للوثيقة مثل الغرض والمنهجية لا تضمن عادة في هذا النوع من الخلاصة فأنه يجب عدم استخدام المصطلح (( خلاصة )) مرادفا للمصطلح ((مستخلص )) .

أهمية المستخلصات (9) :

يعتبر الاستخلاص وسيلة هامة من وسائل استرجاع المعلومات ووسيلة من وسائل الاتصال بين مصادر المعلومات الأولية والمستفيدين لأهميته في توفير وقت المستفيد واطلاعه على كل ما هو جديد في حقل تخصصه من معلومات سواء كانت على شكل كتب او بحوث او وثائق او دوريات .

أن الغرض الرئيسي للمستخلص هو عدم أضاعة وقت الباحث وذلك بأن يقدم أليه المعلومات الموجزة والمركزة والشاملة في الوقت نفسه والتي يحتاج أليها في مجال بحثه او دراسته بدلا من الرجوع إلى الوثائق الأصلية التي تمثل المصادر الرئيسية لهذه المعلومات والأفكار المستخلصة . كذلك فان المستخلص الجيد يمكن المستفيد من الحكم على مدى علاقة الوثيقة بموضوع تخصصه او اهتمامه .

كما يمكن لدوريات المستخلصات التي تقوم بتلخيص البحوث وتجميعها تحت مداخل مناسبة أن تتيح للباحثين القدرة على ملاحقة التطور دون تبديد للوقت والجهد .

المجالات التالية للإفادة من المستخلصات وهي (10) :

1- الإحاطة الجارية : حيث تستخدم المستخلصات كبدائل للوثائق الأصلية في متابعة المتخصصين لما يصدر من إنتاج فكري في مجال اهتماماتهم .

2- الاقتصاد في وقت القراءة : يمكن للمستخلصات أن توفر للقارئ حوالي تسعة أعشار الوقت اللازم لقراءة الوثائق الأصلية . كما أنها تكفل للقارئ الارتفاع بمستوى تمثل واستيعاب ما يقرأ إضافة إلى أنها وسيلة أفضل من غيرها لأغراض وضع محتوى النصوص في حيز التنفيذ .

3- الاقتصاد في تكاليف البحث : الإحاطة الجارية الواعية أهم ضمانات تجنب تكرار البحوث . وطالما كانت المستخلصات تخدم أهداف الإحاطة الجارية وتؤدي إلى الاقتصاد في وقت القراءة فأنها تؤدي حتما إلى الاقتصاد في تكاليف البحث .

4- تيسير الانتفاع : تعد المستخلصات الجيدة من أفضل الوسائل المساعدة للمستفيد في انتقاء الوثائق ذات العلاقة باهتماماته وهي بهذا تتفوق على العناوين والمداخل الكشفية في قدرتها على معاونة الباحث في أنتقاء القراءات المناسبة .

5- المساعدة في تخطي الحواجز اللغوية : هناك حوالي سبعون لغة تستخدم في نشر الإنتاج الفكري في العلوم والتكنولوجيا . أن التشتت اللغوي هذا يجعل من الصعب على الباحث العلمي متابعة ما ينشر في مجال اهتمامه لعدم أجادته اللغات التي تنشر بها تلك البحوث . ومن الممكن التخفيف من حدة هذه المشكلة بتوفير المستخلصات بإحدى اللغات واسعة الانتشار.

6- تيسير بحث الإنتاج الفكري : نظرا لضخامة الإنتاج الفكري من البحوث والدراسات والتقارير الفنية …الخ أصبحت الحاجة ماسة إلى توافر المستخلصات للمساعدة في أجراء ما يسمى بالبحث الراجع للإنتاج الفكري . فبدون المستخلصات المكشفة يمكن أن يكون بحث الإنتاج الفكري المتاح والمحظور على السواء أمرا مستحيلا .

7- الارتقاء بمستوى كفاءة التكشيف : لاشك انه من الممكن تكشيف المستخلصات بشكل أسرع بكثير من تكشيف الوثائق الأصلية . كما أن اعتماد المستخلصات في التكشيف يؤدي إلى الارتفاع بمعدل التكشيف بمقدار يتراوح بين الضعف والأربعة أضعاف . ويؤدي ذلك إلى الاقتصاد في الوقت والجهد والتكاليف دون تضحية تذكر في نوعية الكشافات الناتجة.

8- المساهمة في أعداد المراجعات العلمية : يؤدي الاعتماد على المستخلصات في أعداد الببليوغرافيات والمراجعات العلمية ( Reviews ) إلى التغلب على الصعوبات الناجمة عن ضخامة كم الإنتاج الفكري والتشتت اللغوي لهذا الإنتاج وعدم إمكان الحصول على بعض الوثائق والمستخلصات وحدات مناسبة يمكن الاعتماد عليها في تنظيم كتابة المراجعات وتجميع الببليوغرافيات . هذا بالإضافة إلى أن الحصول على البيانات من المستخلصات للأعتماد عليها في المراجعات العلمية عادة ما يكون أيسر وأكثر كفاءة بكثير من الحصول عليها من المقالات الأصلية .

أنواع المستخلصات :

هناك أكثر من أساس واحد لتصنيف المستخلصات إلى فئات ، فمن الممكن تقسيمها وفقا للغرض من أعدادها إلى مستخلصات إعلامية Informative Abstracts ومستخلصات كشفية او وصفية Indicative or Descriptive Abstracts ومستخلصات نقدية Critical Abstracts ويحتوي المستخلص الإعلامي على الأفكار الرئيسية للوثيقة المعروضة بشكل موجز في حين يدرج المستخلص الوصفي أهم الأفكار فقط .

وكذلك يمكن تصنيف المستخلصات وفقا لطريقة أعدادها إلى مستخلصات موحدة الشكل Formatted Abastracts ومستخلصات تلغرافية Telegraphic Abstracts وأقتباسات Extracts وكذلك يمكن تقسيمها وفقا للقائمين بأعدادها إلى مستخلصات المؤلفين ومستخلصات المختصين الموضوعيين ومستخلصات المستخلصين المحترفين .

وتؤكد المواصفة القياسية العربية رقم ( 425-1984 ) على وجوب كون المستخلص إعلاميا بقدر ما يسمح به نوع الوثيقة وأسلوبها ، أي أنه يجب أن يعرض أكبر قدر ممكن من المعلومات الكمية والنوعية المضمنة في الوثيقة . أن المستخلصات الإعلامية مفضلة بصورة خاصة للنصوص التي تصف عملا تجريبا والوثائق المكرسة لموضوع واحد .

وعلى الرغم من تعدد أسس التقسيم والتصنيف يمكننا أن نحدد الأنواع الرئيسية للمستخلصات بآلاتي (11) :

1- المستخلصات الإعلامية ( Informative Abstracts ):

المستخلص الإعلامي هو المستخلص الذي يتضمن المعلومات الكمية والنوعية المضمنة في الوثيقة ، أي انه تكثيف واضح للأفكار الأساسية والنتائج في الوثيقة الأصل . يكون المستخلص الإعلامي عادة ما بين ( 100-250 ) كلمة إذا أستخلص ورقة مؤتمر او مقال دورية . ولكنه قد يصل إلى (500 ) كلمة إذا كان خاصا بتقرير مطول او رسالة جامعية . وهذا النوع هو أكثر أنواع المستخلصات قيمة إذا توافرت الإمكانات اللازمة لأعداده ، لأنه يوفر وسيلة لتقييم صلة الوثيقة ويمكن من الاختيار او الرفض ، وكذلك يكون بديلا للوثيقة المستخلصة عندما يكون مختصر لها كافيا للباحث .

2- المستخلصات الدلالية ( Indicative Abstracts ) :

المستخلص الدلالي يشير إلى محتوى الوثيقة ويتضمن بيانات عامة حولها ، ولا يحاول الخوض في المحتوى الفعلي لها كما يفعل المستخلص الإعلامي . ومن هذا المنطلق يفيد كوسيلة للاختيار ولكنه لا يصلح بديلا للوثيقة . ويعتبر أعداده أكثر سهولة من أعداد المستخلص الإعلامي ، وبالتالي يتم ذلك بسهولة وسرعة لا يتطلب خبرة موضوعية من جانب كاتب المستخلص . ولهذا فان هذا النوع هو الأكثر انتشارا. ويطلق عليه أحيانا اسم المستخلص الوصفي .

3- المستخلصات الدلالية الإعلامية ( Indicative-Informative Abstracts )

يكون المستخلص الدلالي الإعلامي مستخلصا دلاليا في بعض أجزائه وأعلاميا في الأجزاء الأخرى . يركن إلى هذا النوع عادة إذا كان الجزء الإعلامي يخص اهتمامات القراء . الذين تعد لهم الخدمة بينما يغطي الجزء الدلالي منه ما هو خارج نطاق هذه الاهتمامات . ويتم ذلك إذا كان المستخلص من النوع الموجه نحو الغرض . أي انه ينحرف موضوعيا نحو اهتمامات القراء لكن بعض أنواع المستخلصات تكون موجهة نحو التخصص ، أي أنها تخدم حاجات تخصص معين ( مثل الكيمياء ، الهندسة ) بدون التكيف حسب حاجات واهتمامات فئات معينة من القراء .

4- المستخلصات النقدية ( Citical Abstracts ) :

المستخلص النقدي يصف المحتوى الموضوعي للوثيقة ويقيمه مع أسلوب عرضه . أي انه مستخلص تقييمي ، إذ يعبر كاتب الموضوع عن رأيه في العمل ، كما قد يقارنه مع عمل او أعمال أخرى . ولهذا يكون كاتب المستخلص عادة خبيرا في موضوع المستخلص مما جعل هذا النوع من المستخلصات غير شائع . كما انه يكون عادة طويلا .

5- المستخلصات المصغرة ( Mini Abstracts ) :

يطلق على هذا النوع عدة أسماء حسب شكله ، ومن ذلك ما يلي :

الكلمات المفتاحية : وهي مصطلحات تخصص للتكشيف تمثل محتوى الوثيقة الموضوعي . وهي أقرب إلى التكشيف بالكلمات المفتاحية منها للاستخلاص .

المستخلصات البرقية ( Telegraphic Abstracts ) : وهي أشباه جمل قصيرة تمثل محتوى الوثيقة الموضوعي .

المستخلصات القصيرة : وهي تشتمل عادة على جملة او جملتين تمثل محتوى الوثيقة الموضوعي . ومن هذا النوع ما يسمى مستخلصات النقاط الهامة ( Highlight Abstracts ) وهي المستخلصات المصممة لجلب انتباه القارئ للوثيقة ، ويكون عادة في بداية الوثيقة او في ثناياها . كما قد تكون توسيعا لقائمة محتوياتها .

6- المستخلصات الإحصائية او العددية او المجدولة ( Statistical , Numerical or Tabular Abstracts ) :

هذا النوع وسيلة لتلخيص البيانات الرقمية التي تكون عادة في شكل جداول وهو مفيد بشكل فعال لأنواع معينة من البيانات الاقتصادية والاجتماعية والسوقية . كما أن هناك نوعا مشابها لا يخص البيانات العددية وحدها بل يكون تلخيصا للمحتوى الموضوعي في شكل جدولي . ويطلق على النوع الأخير اسم " المستخلص المهيكل " ( Structured Abstract ) ولأعداده يتم أعداد جدول تترجم أعمدته الجوانب التي يجب أن تلخص من الوثيقة ، حيث يستطيع كاتب المستخلص أن يبحث عنها في الوثيقة ويدونها في الجدول مع قيم ملائمة تخصص حسب الموضوع . وهو مفيد لاستخلاص الوثائق التي تكون العناصر الرئيسية فيها متشابهة .

مواصفات المستخلص الجيد :

يجب أن يتسم المستخلص الجيد بالمواصفات التالية :

1- أن المستخلص الجيد يجب أن يمكن القراء من تحديد المحتوى الأساسي للوثيقة بسرعة ودقة ومن تقرير مدى صلة الوثيقة بأهتماماتهم ومن ثم مدى الحاجة لقراءة الوثيقة كاملة .

2- يجب أن يحصل القراء الذين تمثل الوثيقة اهتماما هامشيا بالنسبة لهم على معلومات كافية من المستخلص مما يجعل قراءتهم للوثيقة بكاملها غير ضرورية .

3- الكمال والضبط والطول : لما كان من الواجب أن يكون المستخلص مفهوما للقارئ دون الحاجة للرجوع إلى الوثيقة الأصلية فيجب أن يكون تاما في ذاته ، وان يستبقي المعلومات والأسلوب الأساسيين للوثيقة الأصلية ، وان يكون مختصرا قدر الإمكان مع تحقيق المتطلبات بالنسبة للمحتوى ولكن لا يكون غامضا او مبهما . ولا يتضمن معلومات او ادعاءات غير موجودة في الوثيقة نفسها .

4- الأسلوب : يجب أن يبدأ المستخلص بجملة موضوعية تكون بيانا جوهريا عن الموضوع الرئيسي للوثيقة . آلا إذا كان هذا مبينا بوضوح في عنوان الوثيقة الذي يسبق المستخلص .

ومن المواصفات الأخرى التي يمكن الإشارة لها في هذا المقام . أن المستخلص الجيد ينبغي أن يغطي الجوانب التالية في الوثيقة :

1- الهدف Purpose : لابد أن يذكر في المستخلص أهداف ومرامي الباحث او الأسباب التي حدت به إلى لكتابة المقال , ويدخل هذا العنصر في كل من المستخلصات الإعلامية والكشفية على السواء .

2- المنهج Method : ويقصد بالمنهج هنا النص على الأساليب التي أعتمدها الباحث في تحقيق الهدف المحدد للبحث .

3- النتائج Results : وهي قائمة بأهم النتائج التي توصل أليها البحث .

4- الاستنتاجات Conclusions : ويقصد بها القرارات التي أنتهى أليها الباحث في تفسير ما أنتهى اليه من نتائج او مدى أهمية هذه النتائج .

5- المحتويات المتخصصة Specialized Contents : هناك بعض المجالات الموضوعية التي تتطلب اشتمال المستخلص على المعلومات المتخصصة .

خطوات أعداد المستخلص :

أن ابرز الخطوات التي تمر بها عملية أعداد المستخلص يمكن أدراجها ضمن الخطوات الثلاثة التالية :

1- قراءة الوثيقة (12) :

الخطوة الأولى في أعداد المستخلص هي قراءة الوثيقة الأصلية كاملة لتكوين صورة واضحة متكاملة عن محتوياتها , ومن الضروري للقائم بالاستخلاص أن يسجل بعض النقاط او الملاحظات أثناء هذه القراءة الأولى للوثيقة .

2- كتابة مسودة المستخلص :

يشرع المستخلص بعد الانتهاء من قراءة الوثيقة في أعداد مسودة للمستخلص اعتمادا على ما سجله من ملاحظات أثناء القراءة .

3- المراجعة والتحرير :

على المستخلص بمجرد الانتهاء من المسودة الأولى مراجعة النص الناتج للتأكد من دقته فيما يتعلق باستعمال علامات الترقيم والنحو والهجاء فضلا عن الاطمئنان إلى تمثيله للوثيقة المستخلصة والتزامه بالقواعد والتعليمات التي ينبغي مراعاتها كافة . وبتحرير هذه المسودة وتدقيقها يتم أعداد النسخة النهائية للمستخلص في صورته الكاملة .

قنوات بث المستخلصات :

يقصد بقنوات بث المستخلصات الوسائط والأشكال التي تقدم بها المستخلصات للمستفيدين . وتتوقف طريقة البث على الهدف من أعداد المستخلصات واحتمالات الإفادة منها . ونعرض في هذا المبحث بإيجاز لأهم سبل بث المستخلصات مع الاهتمام بوجه خاص بالنشرات الإعلامية المحلية او الداخلية ، ودوريات المستخلصات الوطنية وخدمات الاستخلاص العالمية (13) .

1- النشرات الإعلامية الداخلية :

تقوم كثير من الهيئات بأصدار نشرات استخلاص داخلية تغطي الإنتاج الفكري الحديث بهدف إحاطة العاملين بها بالتطورات الجارية في مجالات اهتمامهم . ونظرا لما ينطوي عليه إصدار مثل هذه النشرات من وقت وجهد وتكاليف فأنه لابد من مراعاة أقصى درجات الحرص في التخطيط لها . ولكي تكون مثل هذه النشرات قادرة على تحقيق الهدف منها فأنها ينبغي أن تتسم بالسرعة والفورية فضلا عن الإخراج المقبول والوضوح والقابلية للقراءة والقدرة على جذب أنتباه المستفيدين المحتملين بوجه عام … ولكي تكون النشرة الإعلامية قادرة على اجتذاب المستفيدين فأنها ينبغي أيضا أن تركز على تلك الموضوعات والوثائق التي تحظى بالاهتمام في الوسط المستهدف ، ذلك لأن اتساع التغطية بلا وعي يمكن أن يؤدي إلى زيادة التكاليف وتبديد وقت كل من المسئولين عن النشرة والمستفيدين منها .

2- دوريات المستخلصات الوطنية :

لقد أشار المؤتمر الدولي للاستخلاص في العلوم الذي عقد في باريس عام 1949م إلى أن اليونسكو تؤيد فكرة تشكيل لجان دائمة للاستخلاص على المستوى الوطني او الاقليمي ، حيث تتركز مهام هذه اللجان في دراسة مشكلات الاستخلاص للأرتفاع بمستوى الخدمة وان تعمل على استخلاص الوثائق العلمية التي تنشر في الدول او الأقاليم المعنية ، وذلك على أساس منهجي سليم يكفل التعريف بهذا الإنتاج على المستوى العالمي ، وذلك بصرف النظر عن لغات هذا الإنتاج ومجالاته الموضوعية (14) .

وكانت مصر من بين الدول التي استجابت لهذه الدعوة ، حيث بدأ قسم الوثائق والمخابرات العلمية في المركز القومي للبحوث ( والذي تحول ألان إلى المركز القومي للأعلام والتوثيق ) ، بدأ في عام 1955م إصدار نشرة مستخلصات إقليمية بعنوان :

Abstracts of Scientific and Technical Papers Published In Egypt and Papers Received from Afghanistan , Cyprus , Iran , Iraq , Jordan , Lepanon , Pakistan , Saudi Arabia , Sudan and Syria .

وكانت هذه النشرة تهدف إلى التعريف بما يصدر من إنتاج فكري في العلوم في تلك الدول . وكانت الإنكليزية هي اللغة الأساسية في صياغة المستخلصات . وكانت هذه النشرة تصدر شهريا آلا انه لم يكتب لها الاستمرار . وفي عام 1971م حلت محلها نشرة وطنية مصرية بعنوان U.A.R Science Abstracts صدرت شهريا عن المركز القومي للأعلام والتوثيق بالقاهرة . آلا أنها لم يكتب لها الاستمرار أيضا (15) .

وفي عام 1973م بدأ المركز القومي للأعلام والتوثيق في مصر بالتعاون مع كل من المنظمة العربية للتربية والثقافة والعلوم واتحاد الجامعات العربية ومكتب اليونسكو للعلوم في الدول العربية إصدار نشرة مستخلصات قومية جديدة في العلوم بعنوان Arab Science Abstracts وكانت هذه النشرة تصدر مرتين في العام . وبالإضافة إلى تأخر نشرها حيث لم تصدر مستخلصات عام 1970م آلا في عام 1973م فأن تغطية هذه النشرة للإنتاج الفكري في العلوم كانت تغطية هيكلية لا اكثر حيث لم تتجاوز تغطية المجلد الأول أكثر من 24% من مجموع الدوريات العلمية العربية الجارية عام 1970م .

3- خدمات الاستخلاص العالمية :

تهدف هذه الخدمات إلى تغطية الإنتاج الفكري العالمي بكل أشكاله ولغاته ومنابعه في الحدود الموضوعية التي تضعها كل خدمة لنفسها . وليس من الضروري أن تصدر هذه الخدمات عن منظمات عالمية ، حيث أثبتت بعض الهيئات القومية وخاصة في الولايات المتحدة الأمريكية وبريطانيا قدرتها على العمل على هذا النطاق .

والطباعة ليست هي السبيل الوحيد لبث هذه الخدمات العالمية . فهناك بعض الخدمات التي تبث مستخلصاتها على بطاقات كما هو الحال مثلا Training Abstracts التي تصدر على بطاقات 4×6 بوصة و Publications Abstracts التي تصدر عن الجمعية الأمريكية للمهندسين المدنيين في بطاقات يمكن انتزاعها من النشرة وكذلك الحال أيضا بالنسبة لكل من Building Science Abstracts و Water Resources Abstracts التي يمكن تقطيع صفحاتها إلى بطاقات تشمل كل بطاقة على مستخلص مستقل .

هذا ومن الجدير بالذكر أن معظم خدمات الاستخلاص الرئيسية قد أصبح من الممكن الحصول عليها في شكل قابل للقراءة بواسطة الحاسوب ومن خلال شبكة الإنترنت Intrenet كما أصبحت ألان تتشكل مراصد معلومات يمكن التعامل معها لأغراض الاسترجاع على الخط المباشر .

استخدام الحاسوب في الاستخلاص.

بدأ الاهتمام بالاستخلاص الآلي في مطلع خمسينيات القرن الحالي متأثرا بأتجاهين أساسيين هما تقنيات الحاسوب والترجمة الآلية . فبمجرد أن تبين انه بإمكان الحواسيب معالجة الرموز الهجائية والرقمية على السواء تفتحت مجالات جديدة لأستخدام هذه الأجهزة في معالجة النصوص . فبالإضافة إلى الترجمة الآلية بدأ الاهتمام باستخدام الحواسيب في الاستخلاص الآلي والتكشيف الآلي وتضيف الوثائق آليا . وكان السؤال الذي يواجه الباحثين في هذا المجال هو : إذا كان بالإمكان استخدام الحاسوب في ترجمة وثيقة من لغة إلى أخرى فهل يمكن استخدامه في أعداد ملخص للوثيقة بالآلة نفسها ؟ . وربما كان لون H.P. Luhn ) ) في مقدمة من شغلهم البحث عن الإجابة لهذا السؤال . وفي عام 1958م نشر بحثا يصف فيه طريقة لأعداد المستخلصات الآليا . ويمثل هذا البحث وغيره من جهود لون في مجال استرجاع المعلومات الأساس الذي بنيت عليه الجهود اللاحقة في هذا الميدان (16) .

ماهية الاستخلاص الآلي :

الفكرة الأساسية التي يبنى عليها الاستخلاص الآلي هي أن بعض الجمل التي تشتمل عليها الوثيقة عادة ما تكون غنية بما فيه الكفاية بالكلمات التي تتكرر في ثنايا الوثيقة بشكل يجعل هذه الجمل قادرة على إحاطة القارئ بموضوع الوثيقة كما يفعل المستخلص تماما . وكما يمكن أن نتصور فأن إحصاء عدد مرات تواتر الكلمات في النص ربما كان أيسر ما يمكن أجراؤه بواسطة الحاسوب في معالجة النصوص . كما أن التقاط الجمل المحملة أكثر من غيرها بالكلمات التي تتردد أكثر من غيرها آمر على نفس القدر من البساطة .

خطوات أعداد المستخلص الآلي :

يمر أعداد المستخلص الآلي وفقا لبرنامج لون بالخطوات التالية :

1- يقوم برنامج الحاسوب بتحليل النص بشكل يكفل تحديد معالم الكلمات والجمل وجعلها قابلة للمزيد من عمليات التجهيز عند الطلب .

2- مضاهاة كلمات النص بقائمة الكلمات العامة التي لا تحمل آية دلالة موضوعية كأدوات العطف وحروف الجر والأفعال المساعدة …الخ ، والآمر باستبعادها .

3- ترتيب الكلمات الأخرى ذات الدلالة الموضوعية هجائيا بحيث ترصد حالات ورودها .

4- أجراء عدد من العمليات الإحصائية وتشمل :

أ‌- تجميع كل الكلمات ذات الجذع المشترك لضمان معاملة الأشكال المختلفة للكلمة كوحدة واحدة .

ب‌- ترتيب الكلمات تنازليا وفقا لتواتر ورودها .

ج_ تحديد عدد كلمات الجملة ومتوسط عدد مرات ورود الكلمة .

5- إرجاع الكلمات التي تتردد بكثافة إلى جملها الأصلية وتحديد مواضعها .

6- تحديد مدى التقارب بين الكلمات التي تتردد بكثافة للتعرف على ارتباطاتها النحوية .

7- إعطاء الجملة وزنا او قيمة مناظرة لمربع عدد الكلمات عالية التردد .

وبعد تحديد وزن او قيمة كل جملة ، ترتب الجمل تنازليا حيث يقع الاختبار على أعلاها قيمة لتكون المستخلص الآلي .

آلا أن الجمل الناتجة عن هذه العمليات قلما تبدو مترابطة متكاملة فيما بينها ، ولهذا يرى البعض أن الاستخلاص الآلي بالمصطلح للدلالة على النظام الذي أقترحه لون . وقد أدى ذلك إلى استعمال مصطلح (( الاقتباس الآلي Automatic Extract )) .

والهدف النهائي للبحث في الاستخلاص الآلي او الاقتباس الآلي هو تمكين الحاسوب من قراءة الوثيقة وصياغة مستخلص لها بالأسلوب النثري المألوف . آلا أن السبيل إلى تحقيق هذا الهدف يبدو محفوفا بالصعاب . ويجتذب هذا الموضوع اهتمام العديد من الباحثين .

وعادة ما يمر أعداد الاقتباسات بواسطة الحاسوب بالخطوات التالية (17):

1- تحويل الوثيقة إلى شكل قابل للقراءة بواسطة الحاسوب .

2- وضع معايير عملية للحكم على (( أهمية )) او (( مدى تمثيل )) الكلمات والجمل .

3- تحليل نص الوثيقة بحساب مدى الأهمية او معدلات التمثيل الخاصة بالكلمات والجمل ، ثم التقاط مجموعة الجمل التي تمثل الاقتباس .

4- إخراج الاقتباس وطباعته .

 

ahmedkordy

(رَبَّنَا اغْفِرْ لِي وَلِوَالِدَيَّ وَلِلْمُؤْمِنِينَ يَوْمَ يَقُومُ الْحِسَابُ)

  • Currently 30/5 Stars.
  • 1 2 3 4 5
10 تصويتات / 1330 قراءة
نشرت فى 27 ديسمبر 2010 بواسطة ahmedkordy

أحمد السيد كردي

ahmedkordy
»
جارى التحميل

تسجيل الدخول

عدد زيارات الموقع

8,230,143

أحمد السيد كردي

free counters

 

صورة قلوب متحركه

تابعونا على حساب

أحمد الكردى

 

 موسوعة الإسلام و التنميه

على الفيس بوك

ومدونة
أحمد السيد كردى
على بلوجر


إدعم صفحة كتاب
عمل المرأة عن بعد 
على الفيس بوك للتعرف على الجديد وأهم موضوعات الكتاب