18+
18+
РЕКЛАМА

Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

IT, Образование и наука, Томские новости, ученые наука распознавание речи софт для распознавания машина понимает человека перевод речи Томские ученые изучают шепот для усовершенствования алгоритмов распознавания речи

Научные сотрудники ТУСУРа исследуют малоизученную шепот алгоритмов по распознаванию речи человека с высокой точностью, сообщает региональный инновационный портал.

Над созданием новых, принципиально отличающихся от существующих, алгоритмов распознавания речи работают на кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС). Исследование томичей направлено на решение из главных задач разработчиков во всем мире – добиться полностью автоматического перевода устного текста любого объема в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», - рассказывает сотрудник КИБЭВС Антон Конев.

Основой распространенных алгоритмов является обучение на большом количестве примеров произнесенных звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесенное. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается и существующие системы ошибаются очень часто. Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе», - подчеркивает Конев.

Своей задачей ученые кафедры КИБЭВС ТУСУР называют определение более точных параметров звуков, в том числе, с помощью изучения шепотной речи.

«Есть классический термин – форманта – максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений», - добавил Антон Конев.

Исследования показали, что распознавание ударных звуков шепотной речи на основе общепринятых параметров возможно с надежностью не менее 70 %. Точное распознавание речи, которое станет доступно в результате исследований, будет полезно для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов.

Томские новости

Развитием и содержанием городских парков Томска займется специальная организация

29 марта 2024
Томские новости

Жителей трех поселков в Томской области попросили приготовиться к эвакуации

15 апреля 2024
Томские новости

В Томской области оштрафовали паблик во «ВКонтакте» за отсутствие пометки о рекламе

11 апреля 2024
Томские новости

Хроники томского парламента.
Третий созыв. 2002-2007 годы.
Звездный состав

8 апреля 2024
Томские новости

Томская область хочет построить две посадочные площадки для БПЛА близ районных аэропортов

29 марта 2024
Томские новости

Уровень воды Томи в районе Томска снизился на метр

19 апреля 2024
Томские новости

Ледоход на Томи начался в Кемерове

8 апреля 2024
Томские новости

С сегодняшнего дня в Томской области начался пожароопасный сезон

15 апреля 2024
Томские новости

Из проекта приказа о границах исторического поселения Томска исключены все объекты культурного наследия

22 апреля 2024