Подборка материалов по распознаванию речи
#algorithms@proglib
А вы когда-нибудь задумывались как работает команда "O'кей, Google"? Задумывались ли вы какой путь проходит наш голос от нажатия на микрофончик или произнесения фразы "O'кей, Google", до появления текста в строке? Если да, то эта статья для вас.
Что же такое распознавание речи? Если ответить на этот вопрос просто, то можно сказать что это процесс преобразования речевого сигнала в цифровую информацию.
Эта тема является одновременно и очень интересной, но в тоже время довольно сложной. И к большому сожалению информации по ней не очень много. Но кое-что все же можно найти. Ознакомившись с материалами следующих ссылок, вы поймете основные понятия такой интересной темы как распознавание речи.
1. Статья по распознаванию речи на Википедии https://goo.gl/f38vxq
2. Распознавание речи. Часть 1. Классификация систем распознавания речи
http://geektimes.ru/post/64572/
3. Распознавание речи. Часть 2. Типичная структура системы распознавания речи
http://geektimes.ru/post/64594/
4. Распознавание речи. Часть 3. Голосовой тракт, слуховой тракт
http://geektimes.ru/post/64681/
5. Статья от Яндекса, как устроен Yandex.SpeechKit
http://habrahabr.ru/company/yandex/blog/198556/
6. Сверхбыстрое распознавание речи без серверов на реальном примере
http://habrahabr.ru/post/237589/
7. Sphinx-4 Достаточно интересная библиотека, написанная на Java
http://cmusphinx.sourceforge.net/sphinx4/
8. Многоуровневая система распознавания речи
http://websound.ru/articles/theory/speech.htm