Общероссийская общественная организация инвалидов "Всероссийское общество глухих" (ВОГ)

Как речь превратить в субтитры

Специалисты «Центра речевых технологий» продемонстрировали свои разработки по автоматическому распознаванию речи в режиме реального времени.

16 апреля в офисе Управления социальной политики и реабилитации ВОГ состоялась встреча специалистов Общества глухих с представителями «Центра речевых технологий» (ЦРТ) и Министерства связи РФ, во время которой были продемонстрированы результаты работы над системой автоматического распознавания голосовой речи. Она ведется специалистами ЦРТ в рамках государственной программы «Доступная среда»  с 2011 года по контракту с Минсвязи РФ.

Выступают руководители проектов ЦРТ Владимир Щелчков (справа) и Евгения Лац (слева). Переводит Мария Кириллова (в центре)


Эта работа важна для глухих в первую очередь благодаря возможности применения ее на телевидении. Прямой эфир и новостные программы – вот те случаи, когда технологии распознавания речи совершенно незаменимы. Ведь в настоящее время скрытые субтитры на ТВ появляются после многочасовой подготовки – в среднем занимающей не менее 12-15 часов для одного часа эфира. Новости мы смотрим с бегущей строкой (когда она есть), но едва там появляются срочные репортажи или прямой эфир, как бегущая строка исчезает. Тем самым нарушаются права глухих телезрителей на получение полной информации. Внедрение технологии ЦРТ в работу ТВ позволит нам не только получить полный доступ к теленовостям, но и увеличить количество субтитрированных передач в целом.

Евгения Лац преобразует речь Александра Коляды в субтитры


Наглядная схема работы системы распознавания речи


Специалисты ВОГ смогли непосредственно познакомиться с этой технологией – через подключенный к компьютеру микрофон они диктовали текст из газет или интернет-СМИ, а на экране ТВ появлялись готовые субтитры. Отметим: не сразу, а с небольшой задержкой. Такова программа – распознавание речи искусственный разум производит за 2-5 секунд. Но согласитесь, это не так важно. И ошибки в распознавании слов и окончаний, которые иногда имеют место, связаны с разной разборчивостью речи говорящих. Лучше всего компьютер распознает постоянного диктора, в результате и ошибок меньше. Но систему ЦРТ еще предстоит дорабатывать и шлифовать: работы будут продолжены и в 2014 году.

Уже летом этого года, как рассказал руководитель проектов ЦРТ Владимир Щелчков, планируется запустить новую стадию проекта: автоматическая подготовка скрытых субтитров в связке с двумя обученными респикерами (дикторами), а специалисты ВОГ смогут оценить результаты этой работы.

Александр Иванов


Начальник отдела реабилитации ВОГ Александр Иванов поблагодарил разработчиков системы (кстати, он и вице-президент ВОГ  С.А. Иванов входят в Комиссию при Минсвязи по приемке этого комплекса) за проделанную работу и выразил надежду на дальнейшее сотрудничество. А то, что оно реально, подтверждают и предложения ЦРТ: «В оценке качества субтитров должен принимать не только производитель, но и потребитель (лица с нарушением слуха). Желательно привлечение специалистов ВОГ как экспертов качества».

ВОГинфо.ру

Добавить комментарий