Вопрос коллегам: Распознавание речи и автоматизированное стенографирование

14 ноября 2019
5 2212
 Есть ли у коллег опыт успешного внедрения распознавания речи и автоматизированного стенографирования? В процессе решения задачи автоматизации стенографирования сеансов видеоконференцсвязи и телефонных звонков от граждан о событиях лесопожарной тематики, нашей организацией было апробировано облачное решение Yandex Speechkit. Однако на реальных записях качество распознавания речи оставляет желать лучшего: не более 20 процентов аудиоинформации преобразуется правильно в текст. Что вы порекомендовали бы?
Коментарии: 5

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

  • Анна Кожурина
    Рейтинг: 13
    Главный редактор
    21.11.2019 10:29

    Дмитрий Новиков, директор Алььфаком оставил комментарий: у яндекса полноценная платформа Алиса с удобным API в принципе можно через него реализовать

  • Владимир Фишер
    Рейтинг: 12
    ФБУ Авиалесоохрана
    Заместитель начальника ОИТ, руководитель направления Информационные системы
    22.11.2019 21:35

    Алиса использует как раз Speechkit для распознавания голоса, так что вряд ли удастся повысить качество распознавания просто сменой API. Но изучим различия, спасибо!

  • Тарас Афанасенко
    Рейтинг: 12
    Федеральное агентство по печати и массовым коммуникациям
    Начальник отдела информационно-коммуникационных технологий
    26.11.2019 01:08

    voximplant.com - мне понравилось.

    • Владимир Фишер Тарас
      Рейтинг: 12
      ФБУ Авиалесоохрана
      Заместитель начальника ОИТ, руководитель направления Информационные системы
      27.11.2019 11:33

      Тарас, спасибо! У вас внедрено данное решение? Качество распознавания приемлемое?

  • Тарас Афанасенко
    Рейтинг: 12
    Федеральное агентство по печати и массовым коммуникациям
    Начальник отдела информационно-коммуникационных технологий
    29.11.2019 01:24

    Я пробовал это решение с ручками на уровне написания кода. Ошибок при распозновании практически не было может 1-2 символа не точно на длинное предложение. Но тут тестировать надо на ваших примерах. Туда же по логике если это лесные пожары надо прикручивать автоматизацию создания события от звонка, классификацию возможно с помощью ИИ. Если интересно у меня где то был тестовый стенд, можно протестировать.

Предметная область
Отрасль
Управление