robogeek.ru

все о роботах и робототехнике

edu.robogeek.ru

все об обучении робототехнике

Новый ИИ читает по губам

Новое программное обеспечение (ПО) на базе ИИ называется WAS (Watch, AttendandSpell ), оно было разработано в Университете Оксфорда в сотрудничестве с компанией DeepMind.

Система ИИ использует компьютерное зрение и методы машинного обучения, чтобы научиться читать по губам, применяя для этого набор данных, включающий телевизионные кадры длительностью более 5000 часов из шести различных телепрограмм. В этих видео-фрагментах содержится более 11 8000 предложений и словарь из 17 500 слов.

Исследователи сравнили способности машины и человека-эксперта в распознавании речи по движениям губ говорящего. Они обнаружили, что ПО оказалось более точным. Человек правильно причитал по губам 12% сказанных слов, в то время как ПО WAS распознало 50% слов без ошибок. Неточности машины были небольшими, включая пропуск буквы "s" в конце английских слов.

Это ПО может найти целый ряд применений, в том числе помогая слабо слышащим людям ориентироваться в окружающем мире.

Есть также множество других вариантов использования. Например, диктовка инструкций по телефону в шумной обстановке, перезапись архивных немых фильмов, повышение эффективности автоматизированного распознавания речи в целом.

Комментарии

(0) Добавить комментарий

Новые комментарии

Опрос: Какой твой любимый робот в кино?
Александр
21.06.2017
12:05:58
ВАЛЛ-И
Робот предскажет результаты матчей Кубка Конфедерации FIFA
Гость
16.06.2017
04:03:11
Осьминогу уже не доверяют?