robogeek.ru

все о роботах и робототехнике

edu.robogeek.ru

все об обучении робототехнике

Новый ИИ читает по губам

Новое программное обеспечение (ПО) на базе ИИ называется WAS (Watch, AttendandSpell ), оно было разработано в Университете Оксфорда в сотрудничестве с компанией DeepMind.

Система ИИ использует компьютерное зрение и методы машинного обучения, чтобы научиться читать по губам, применяя для этого набор данных, включающий телевизионные кадры длительностью более 5000 часов из шести различных телепрограмм. В этих видео-фрагментах содержится более 11 8000 предложений и словарь из 17 500 слов.

Исследователи сравнили способности машины и человека-эксперта в распознавании речи по движениям губ говорящего. Они обнаружили, что ПО оказалось более точным. Человек правильно причитал по губам 12% сказанных слов, в то время как ПО WAS распознало 50% слов без ошибок. Неточности машины были небольшими, включая пропуск буквы "s" в конце английских слов.

Это ПО может найти целый ряд применений, в том числе помогая слабо слышащим людям ориентироваться в окружающем мире.

Есть также множество других вариантов использования. Например, диктовка инструкций по телефону в шумной обстановке, перезапись архивных немых фильмов, повышение эффективности автоматизированного распознавания речи в целом.

Комментарии

(0) Добавить комментарий

Новые комментарии

Роботы смогут стать частью муравьиной колонии
Гость
11.10.2017
10:36:42
В своем следующем проекте исследователям следует сфокусироваться на повышении качества жизни у тараканов - они (тараканы) намного более близки...
Мой друг – робот. Социокультурные аспекты социальной робототехники
Татьяна
01.10.2017
02:03:46
Отличный курс, очень интересный!