News.ua


Intel кардинально улучшит распознавание человеческой речи компьютером

Декабрь 10
03:56 2021

Intel представила на ежегодной конференции по системам обработки нейронной информации Neural Information Processing Systems (NeurIPS) два новых датасета, которые помогут улучшить технологии распознавания речи.

Первый набор Intel People’s Speech направлен на задачи по автоматическому распознаванию речи. Второй — Multilingual Spoken Words Corpus (MSWC) — на определение ключевых слов.

Работу над датасетами начали в 2018 году. Целью было объединить в наборе данных более 50 самых распространённых языков в мире. Это пригодится, например, в создании систем для автоматического перевода.

Особенности датасетов в том, что они содержат не «театральные» аудиозаписи речи, а записи, сделанные в естественной среде. Обучаясь на таких, алгоритм сможет затем точнее распознавать естественную речь, которую человек надиктовывает прямо на микрофон.

В первом датасете находятся десятки тысяч часов разговоров. В настоящее время это один из крупнейших в мире наборов данных для распознавания речи на английском языке. В MSWC содержится более 300 тысяч ключевых слов на десятках языков. Датасет можно использовать в голосовых помощниках, например.

Источник: ferra.ru

Share

Статьи по теме







0 Комментариев

Хотите быть первым?

Еще никто не комментировал данный материал.

Написать комментарий

Комментировать

Залишаючи свій коментар, пам'ятайте, що зміст та тональність вашого повідомлення можуть зачіпати почуття реальних людей, що безпосередньо чи опосередковано пов'язані із цією новиною. Виявляйте повагу та толерантність до своїх співрозмовників. Користувачі, які систематично порушують це правило, будуть заблоковані.

Website Protected by Spam Master


Останні новини

Смартфон Samsung Galaxy S27 Pro може отримати перевагу над Ultra в найважливішій функції

0 комментариев Читать всю статью

Ми в соцмережах



Наші партнери

UA.TODAY - Украина Сегодня UA.TODAY
News.ua