ما هي تقنية التعرف على الصوت وكيف تعمل؟

أحدثت تقنية التعرف على الصوت(Voice Recognition) ثورة في وجه التجارة إلى جانب استخدام الأجهزة المنزلية. لقد احتلت مركز الصدارة ولكن هل تختلف عن كتابة استعلام في محركات البحث؟ دعونا نتعرف على أسباب انتشاره واعتماده.

تقنية التعرف على الصوت

ما هو التعرف على الصوت

تعمل التقنية بشكل أساسي من خلال تحليل الأصوات المرتبطة بمعالجة اللغة الطبيعية(Natural Language Processing) ( NLP ). إنه فرع من فروع الذكاء الاصطناعي يساعد أجهزة الكمبيوتر على فهم وتفسير ومعالجة اللغة البشرية. تستمد معالجة اللغة الطبيعية(Natural Language Processing) المعنى من اللغات البشرية من خلال الاعتماد على تقنيات التعلم الآلي.

أسباب انتشار تقنية التعرف على الصوت(Voice Recognition) واعتمادها

لا يتم تفعيل أي محادثة بشكل صحيح إذا كانت تفتقر إلى وتيرة أسرع لتوصيل المعلومات. لا يملأ التعرف على الصوت(Voice) هذا الفراغ فحسب ، بل يوحّد أيضًا جميع الوسائل الأسرع لآليات توصيل المعلومات تحت سقف مشترك للتحول الرقمي.

فيما يلي الأسباب التي أدت إلى زيادة انتشار تقنية التعرف على الصوت وانتشارها.(Voice)

  1. يجعل(Makes Telephone) الخدمات المصرفية عبر الهاتف أكثر أمانًا وراحة
  2. استخدام الروبوتات التي يتم تنشيطها بالصوت
  3. أفضل في إنتاج النصوص من ثقب الكلمات من لوحة المفاتيح
  4. الطريقة المثالية لتخفيف بعض مضايقات السفر والترجمة في الوقت الفعلي
  5. إعادة بناء المحادثات من مقاطع الفيديو

1] يجعل(Makes Telephone) الخدمات المصرفية عبر الهاتف أكثر أمانًا وراحة

يمكن للمحتالين أو المتسللين التخمين والوصول إلى رقم التعريف الشخصي(PIN) وكلمة المرور(Password) المصرفية الخاصة بك ، لكن لا يمكنهم تكرار صوتك. يعد المساعد الصوتي المستند إلى AI حساسًا بدرجة كافية لاكتشاف ما إذا كان هناك شخص ينتحل شخصيتك أو يقوم بتشغيل تسجيل. وبالتالي ، وإدراكًا لفوائد التعرف على الصوت(Voice) للخدمات المصرفية ، يتحول العديد من البنوك في جميع أنحاء العالم إلى التعرف على الصوت(Voice Recognition) لجعل تجربة الخدمات المصرفية عبر الهاتف مريحة وآمنة.

2] استخدام الروبوتات التي يتم تنشيطها بالصوت

الدردشة من خلال النص لها حدودها. تتمتع الروبوتات التي يتم تنشيطها بالصوت بأوقات استجابة أسرع من روبوتات الدردشة. علاوة على ذلك ، غالبًا ما يفتقر النص الآلي البسيط إلى المشاعر الشخصية ، مما يجعل الاتصال باهتًا وفي بعض الأحيان ، وحتى مرهقًا. يوفر التحدث إلى روبوت يعمل بالذكاء الاصطناعي تجربة مختلفة تمامًا. إنه مرضي وحقيقي للغاية ، قد تعتقد أنك تجري محادثة مع صديق. يتم إثراء هذا الحل بصوت يزيل الشعور المعتاد بالتحدث إلى مجرد آلة.

إلى جانب كل ذلك ، يوفر chatbot الذي يتم تنشيطه صوتيًا معلومات غنية وصحيحة وفورية.

3] أفضل(Better) في إنتاج النصوص من ثقب الكلمات من لوحة المفاتيح

تقضي الغالبية العظمى من المستخدمين اليوم وقتًا طويلاً في إرسال الرسائل النصية على الهواتف الذكية(Smartphones) . لكن لوحة المفاتيح المصغرة التي تعمل باللمس في الهاتف الذكي يمكن أن تكون بطيئة ومحبطة الاستخدام ، خاصة عندما يريد المستخدم كتابة رسالة طويلة. لذلك ، نظرًا لعدد المرات التي يقضيها المستخدمون على الهواتف الذكية والأجهزة المحمولة الأخرى ، يظل من المهم تصميم طريقة فعالة لإدخال النص خارج سطح المكتب يمكن أن تقلل إلى حد كبير من إحباط المستخدمين وتحسن الكفاءة.

تقدم التطورات الحديثة في التعرف على الكلام (بفضل ظهور نماذج التعلم العميق والحساب) حلاً لهذه المشكلة. وجدت دراسة حديثة أجرتها(recent study) جامعة واشنطن (University)وجامعة(Washington) ستانفورد أن نظام التعرف على الصوت أفضل في إنتاج نص من كتابته على لوحة المفاتيح . (Stanford University)كشفت الدراسة أن سرعات إدخال النص ، بالكلمات في الدقيقة ( WPM ) ، كان استخدام الكلام أسرع بنحو 3.0 مرات من لوحة المفاتيح للغة الإنجليزية(English) (161.20 مقابل 53.46 WPM )(WPM) .

4] طريقة مثالية(Ideal) لتخفيف بعض مضايقات السفر والترجمة في الوقت الفعلي

من بين العديد من الأشياء التي تحدد تجربة السفر لدينا ، تحتل اللغة مكانة مركزية. إنها الوسيلة الرئيسية للاتصال. لعب التعرف على الكلام أو الصوت دورًا مهمًا في تحسين وضع الاتصال هذا عن طريق الترجمة بين اللغات. على سبيل المثال ، Skype Translator ، تطبيق يستخدم عجائب التعلم الآلي(Machine Learning) للاستماع ومعرفة أنماطك المنطوقة والمكتوبة. بفضل قدرته على ترجمة النص بأكثر من 60 لغة ، يمكن أن يساعدك على الهبوط في منطقة الراحة اللغوية ، خاصة عندما تكون بعيدًا عن المنزل على أرض بعيدة.

5] إعادة بناء المحادثات من أشرطة الفيديو

قد تكون الابتكارات في التعرف على الصوت مفيدة في إحداث ثورة في طرق إجراء المحاكمات الجنائية. على سبيل المثال ، يمكن لفك تشفير ما يقال على لقطات كاميرات المراقبة(CCTV) في مسرح الجريمة أن يعطي رؤى حيوية حول كيفية ارتكاب الجريمة ، أو يشير إلى مزيد من المشتبه بهم. يجري الباحثون في جامعة إيست (University)أنجليا(East Anglia) تجارب على تقنية التعرف على الكلام المرئي التي يمكن أن تعيد بناء المحادثات (من خلال التعرف على مظهر وشكل الشفاه البشرية) الملتقطة بالفيديو حتى في حالة عدم وجود صوت. ظلت هذه واحدة من أكثر المشاكل تحديًا في الذكاء الاصطناعي وعلى هذا النحو ، فقد جذبت انتباه الباحثين.

تتمثل إحدى الفوائد الرئيسية المفهومة لتقنية التعرف على الصوت في قدرتها على تمكين ذوي الإعاقات البصرية من الوصول نفسه مثل أولئك الذين لا يعانون من إعاقة بصرية.

في الأيام القادمة ، كان بإمكاننا أن نتوقع فقط أن يصبح التعرف على الصوت(Voice) والذكاء الاصطناعي أكثر تعقيدًا في المستقبل. تقوم مئات الشركات بالفعل بتجربة دمج منتجاتها وخدماتها مع المساعدين الصوتيين الرقميين.

مصدر الصورة(Image Source) - IJRASET .



About the author

أنا مسؤول Windows 10 و Windows 11/10 ذو خبرة ولدي بعض الخبرة في Edge. لدي ثروة من المعرفة والخبرة لأقدمها في هذا المجال ، ولهذا السبب أعتقد أن مهاراتي ستكون رصيدًا قيمًا لشركتك. تمنحني سنوات خبرتي في كل من Windows 10 و Edge القدرة على تعلم التقنيات الجديدة بسرعة وحل المشكلات بسرعة وتحمل المسؤولية عندما يتعلق الأمر بإدارة عملك. بالإضافة إلى ذلك ، فإن تجربتي مع Windows 10 و Edge تجعلني على دراية كبيرة بجميع جوانب نظام التشغيل ، مما سيكون مفيدًا لإدارة الخوادم أو إدارة تطبيقات البرامج.



Related posts