قامت شركة DeepMind , الفرع التّابع للعملاق غوغل , بالشّراكة مع جامعة أكسفورد بإرساء قواعد نظام برمجيّ قادر على تحويل حركات الشّفتين إلى نصّ مقروء و مسموع . هذا و توجد بالفعل عدّة تطبيقات واقعيّة خاصّة بهذا البرنامج .
بعد أن فازت بلقب بطولة العالم في لعبة Jeu de Go , ها أنّ شركة DeepMind تعود من جديد . هذه المرّة , قامت الشّركة البريطانيّة بتطوير تكنولوجيّة للذّكاء الإصطناعي قادرة على قراءة حركة الشّفتين و تحويلها بشكل مبتكر و ذكيّ إلى صوت بشريّ على نصّ مقروء .
حجم مصداقيّة و صحّة هذا البرنامج هي أكبر و أعلى من مصداقيّة و صحّة أفضل الخبرات البشريّة .
في الواقع , هذا البرنامج المسمّى LipNet , توصّل إلى تحقيق حجم إجمالي للمصداقيّة و الصّحّة عادل 46.9 % على مستوى التّعرّف على الجمل المنطوقة , مقابل 23 % بالنّسبة للشّهادات الإحترافيّة .
و في وقت مازالت فيه برمجيّات التّعرّف الشّفاهيّة الحاليّة إلى الآن , تعمل على الكلمات المنفصلة , فقد مرّ برنامج LipNet بالفعل إلى مرحلة أبعد , و هو سيقوم في المستقبل بترجمة جمل كاملة .
لتعلّم كيفيّة قراءة الكلمات على الشّفاه البشريّة , إستمعت هذه البرمجيّة إلى ما لا يقلّ عن 5000 ساعة من برامج محطّة BBC التّلفزيونيّة .
رسالة إلى هاتف , نقل , دوبلاج أفلام :
هذا البرنامج تمّ تطويره من طرف باحثين من شركة DeepMind بالتّعاون مع علماء من جامعة أكسفورد .
و من خلال ملخّصات و خواتيم بحوثهم , وجد هؤلاء الباحثون بالفعل , التّطبيقات القويّة المتناغمة مع هذه الصّيغة الجديدة من تكنولوجيّات الذّكاء الإصطناعي : ” آلة قادرة على قراءة حركة الشّفاه , ستفتح الطّريق أمام تطبيقات متعدّدة مثل “إملاء التّوجيهات” , “إملاء الرّسائل نحو الهواتف الجوّالة في محيط مليء بالضّجيج , النّقل ( transcription ) و دوبلاج الأفلام دون صوت , و بشكل أوسع , تحسين الأداء و التّعرّف الصّوتي ”
علاوة على هذا , لا يمكننا أن نمنع أنفسنا من التّخمين حول ما يمكن لعمليّة إستخدام مثل هذا البرنامج , أن تعطيه لهيئات التّعليم .