edu.robogeek.ru

все об обучении робототехнике

prom.robogeek.ru

все о промышленной робототехнике

Основное меню
Категории новостей

Новый ИИ читает по губам

Новое программное обеспечение (ПО) на базе ИИ называется WAS (Watch, AttendandSpell ), оно было разработано в Университете Оксфорда в сотрудничестве с компанией DeepMind.

Система ИИ использует компьютерное зрение и методы машинного обучения, чтобы научиться читать по губам, применяя для этого набор данных, включающий телевизионные кадры длительностью более 5000 часов из шести различных телепрограмм. В этих видео-фрагментах содержится более 11 8000 предложений и словарь из 17 500 слов.

Исследователи сравнили способности машины и человека-эксперта в распознавании речи по движениям губ говорящего. Они обнаружили, что ПО оказалось более точным. Человек правильно причитал по губам 12% сказанных слов, в то время как ПО WAS распознало 50% слов без ошибок. Неточности машины были небольшими, включая пропуск буквы "s" в конце английских слов.

Это ПО может найти целый ряд применений, в том числе помогая слабо слышащим людям ориентироваться в окружающем мире.

Есть также множество других вариантов использования. Например, диктовка инструкций по телефону в шумной обстановке, перезапись архивных немых фильмов, повышение эффективности автоматизированного распознавания речи в целом.

Комментарии

(0) Добавить комментарий