لانـد تــك

موقع تقنى يهتم بكل ماهو جديد في عالم التكنولوجيا والمعلومات ومايخص الانترنت والكمبيوتر والموبايلات

التحدث الى الكمبيوتر ماهو

إن فكرة التحدث إلى الآلة لشئ مثير للدهشة والأعجاب، أيمكن أن نأمر مثلا باب المصعد ليبق مفتوحا؟ بأن ننادى عليه ونأمره “أفتح الباب” أو نأمر جهاز الفيديو بأن يسجل برنامجا معينا الساعة التاسعة غدا، أو أن نبعث رسالة إلى صديق عن طريق تلقين الكمبيوتر نص الرسالة شفويا ومن ثم يقوم بإرسالها إلى العنوان المطلوب.


منذ حوالى 30 سنة و البحث جارى فى كلا من إمريكا واليابان حول تطوير الكمبيوتر الذى يستجيب إلى الأوامر الصوتية، وهذا المشروع يعرف بأسم Speech recognition. وقد ظهرت اجهزة تليفون قادرة على تنفيذ أوامر صوتية بسيطة مثل اتصل بالبيت أو بالعمل، و كذلك مؤخرا وبعد عشرات السنين من البحث سوقت شركة IBM أول طابعة صوتية Speech writer قادرة على التعرف على 20000 كلمة انجليزية بدقة تبلغ 90% و سرعة طباعة بمعدل 70 كلمة فى الدقيقة.  كذلك طورت شركة الكمبيوتر Compaq دائرة الكترونية مع ميكروفون توصل بالكمبيوتر لتمكن المستخدم من اعطاء أوامر “الدوس” أو DOS Commands بالتحدث للجهاز بدلا من طباعتها ولكن كان سعر هذا الكمبيوتر أعلى بـ4000$ عن سعره الأصلى.

 

المشاكل التى تواجه الباحثيين

إن الوصول إلى وسيلة للتحدث إلى الكمبيوتر يعنى إنه يمكننا التحكم بكل شئ من ساعة اليد إلى الطائرة الحربية عن طريق الأوامر الصوتية.  ولكن قبل الوصول إلى هذا المستوى من التقدم التكنولوجى فإنه لابد من حل بعض المشاكل مثل صعوبة لفظ الكلمة نفسها مرتيين بنفس الطريقة حتى من قبل نفس المتحدث كأن تكون ممدودة أو مشوشة بسبب مرض أو غيره وكذلك الأختلاف فى اللهجة من مكان إلى آخر و اختزال بعض الأحرف أثناء الحديث خاصة اذا تشابهة نهاية الكلمة مع بداية الكلمة التالية لها أو أن تكون الكلمات لها نفس النطق ولكن تختلف فى المعنى.  وبالتالى لابد من وجود وسيلة تمكن الكمبيوتر من تلافى الوقوع فى مثل هذه الأخطاء.

التغلب على تلك المشاكل

الحل الأمثل هو تصميم كمبيوتر قادر على فهم قواعد اللغة وما يعنيه المتحدث أى Artificial intelligence.  و للوصول إلى هذا النظام المتقدم لجأ الباحثون إلى تطوير نظام يعتمد على مقارنة الاشارات الصوتية يعرف باسم Pattern matching وفكرة عمل هذا النظام هى تخزين الاشارات الصوتية لكل الكلمات فى ذاكرة الكمبيوتر بالإضافة إلى تخزين الاشارات الصوتية لكل صور النطق الممكنة للكلمة الواحدة.  وكل اشارة صوتية مخزنة قسمت إلى 100 مقطع فى الثانة الواحدة.  وبهذه الطريقة تم التغلب على مشكلة الأختلاف اللفظى للكلمة من شخص إلى آخر و يسمى هذا النظام Dynamic time warping.  بعد ذلك عند اصدار الأوامر الصوتية من قبل المتحدث عبر ميكروفون متصل بالكمبيوتر يقوم الكمبيوتر بمقارنة الاشارة الصوتية الصادرة من المتحدث بعد تقسيمها إلى 100 مقطع فى الثانية مع الاشارات الصوتية المخزنة فى ذاكرته فيتعرف عليها.  وهكذا يفعل الكمبيوتر مع كل كلمة يستقبلها بواسطة الميكروفون.

التطبيقات العملية

فى الحقيقة مازال البحث جارى والأفكار و التجارب مستمرة للوصول إلى دقة تقارب 100% ولكن فكرة التحكم بالاجهزة بدأت تطبق فى الأن العديد من المجالات مثل العمل فى المصانع ذات البيئة الصعبة مثل ارتفاع درجات الحرارة أو وجود مواد وغازات سامة، كذلك فى غرف العمليات الجراحية يحتاج الطبيب للتحكم بالاجهزة دون استخدام يديه منعا للتلوث، كذلك فى معامل صناعة الألكترونيات الدقيقة و التى تحتاج إلى غرف نظيفة جدا، وهذا بالإضافة إلى إلى الاستخدامات اليومية مثل آجراء الأتصالات و حجز تذكرة السفر و الفندق بأن يقوم الشخص بالتحدث مع الكمبيوتر بالهاتف مباشرة لأداء اجراءات السفر أو فى الحصول على معلومات ما.

هل ما ذكر آخر مسلسل التطور؟

قد يعتقد البعض ان هذا سوف يكون احدث شيئ ممكن أن نتصوره و لكن هناك فكرة اكثر غرابة وهى الأتصال الفكرى مع الكمبيوتر، أى أنك يمكن نقل معلومات أو اوامر للكمبيوتر بمجرد التفكير بها اى يصبح الكمبيوتر قادر على قراءة افكارك أو التجسس عليها.  هذا الكمبيوتر يعتمد على ان التفكير يحدث تغيرات معينة فى بعض العضلات وكذلك فى الاشارات العصبية الصادرة لها وخاصة فى الحلق واللسان فإذا ما تم ايصال هذه الأعضاء بميكروفونات حساسة جدا (ارجع إلى مقال الموصلات الفائقة التوصيل للكهرباء) تلتقط هذه التغيرات ومن ثم ترسلها إلى الكمبيوتر الذى يقوم بدوره فى تحليل وفهم هذه الاشارات بناءا على المعلومات المخزنة مسبقا فى ذاكرته.

  • Currently 15/5 Stars.
  • 1 2 3 4 5
5 تصويتات / 228 مشاهدة
نشرت فى 9 يونيو 2011 بواسطة sherifmohamed

لا نـــد تــــــــــــك

sherifmohamed
موقع شامل يخص كل ماهو جديد فى مجال تكنولوجيا التعليم والمعلومات والكمبيوتر والانترنت والمزيد »

ابحث

تسجيل الدخول

عدد زيارات الموقع

999,972