Цифровые сигнальные процессоры Вопросы, связанные с применением цифровых сигнальных процессоров: программирование, отладочные средства, алгоритмы... |
12.10.2010, 20:40
|
|
Гражданин KAZUS.RU
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
|
Вопрос из распознавания речи
Практически восстановил работу 20 летней давности, сделал плату преобразования естественной речи, позволяющую в случае применения со стандартными программами распознавания речи комплектовать её словарём неограниченного размера. Остался финальный шаг, его я не сделал в своё время потому, что нынешних возможностей купить PIC или АVR не было.
Проблема в том, что я не знаю принципов выбора частоты дискретизации выходного сигнала с точки зрения СТАНДАРТОВ. Про теорему Котельникова я слыхал . У меня есть диктофон Олимпус с частотой дискретизации 22,5 кГц и полосой 300 - 7200Гц, его сигнал я использую как надо и далее следует вывод. Мой сигнал будет иметь полосу 300 - 4800Гц. Какую частоту дискретизации выбирать исходя из СТАНДАРТОВ?
|
|
|
|
12.10.2010, 20:47
|
|
Вид на жительство
Регистрация: 05.01.2007
Адрес: Украина, г. Макеевка
Сообщений: 408
Сказал спасибо: 229
Сказали Спасибо 62 раз(а) в 52 сообщении(ях)
|
Re: Вопрос из распознавания речи
Думаю правильным ответом в данной ситуации именно будет теорема Котельникова. При чем тут стандарты, в ПК собственно ей тоже пользуються, в смысле теоремой, частоту 44100 Гц тоже не с потолка взяли.
Хотя, если уж сильно охота влесть в стандарты, то думаю, Вам стоит смотреть в сторону звуковых файлов типа mp3 и wav
__________________
____________________________________________
Internet Explorer - это такая программа, с помощью которой можно зайти на сайт http://opera.com и скачать себе браузер...
|
|
|
|
12.10.2010, 20:49
|
|
Гражданин KAZUS.RU
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
|
Re: Вопрос из распознавания речи
Сообщение от Nikopol
|
Думаю правильным ответом в данной ситуации именно будет теорема Котельникова. При чем тут стандарты, в ПК собственно ей тоже пользуються, в смысле теоремой, частоту 44100 Гц тоже не с потолка взяли.
|
Да я думаю об этом в связи с цифровой телефонией: вокодеры всякие и прочее. Думается лучше сразу зацепиться за какой-то стандарт. С точки зрения WAV следует делить 22,5 на 2 и будет 11,25, но годится ли это вокодерам? не придётся ли перекодировать и помехи создавать?
Последний раз редактировалось NikMih_1; 12.10.2010 в 20:55.
Причина: Уточнение.
|
|
|
|
12.10.2010, 21:02
|
|
Супер-модератор
Регистрация: 08.09.2007
Адрес: Kyiv, Ukraine
Сообщений: 7,963
Сказал спасибо: 428
Сказали Спасибо 3,938 раз(а) в 1,690 сообщении(ях)
|
Re: Вопрос из распознавания речи
Частотный диапазон речи со всеми своими формантами не так уж и велик. От 70 до 7000 Гц. По другим данным - 300-4000 Гц. Как видите, довольно большой разброс. Так что спокойно выбирайте удобный для Вас "стандарт" - и вперёд.
__________________
Выслушай и противную сторону, даже если она тебе и противна!..
|
|
|
|
12.10.2010, 21:07
|
|
Гражданин KAZUS.RU
Регистрация: 30.05.2008
Адрес: Нижний Новгород
Сообщений: 903
Сказал спасибо: 90
Сказали Спасибо 1,276 раз(а) в 414 сообщении(ях)
|
Re: Вопрос из распознавания речи
Может, стоит ориентироваться на способы кодирования речи в сотовых телефонах:
...С микрофона речевой сигнал поступает в тракт передачи. Там он на первом этапе сегментируется (разбивается на сегменты длительностью 20 мс), а затем преобразуется в цифровой поток со скоростью 13 кбит/с (один сегмент составляет кодовую последовательность из 260 бит). Поскольку частотный спектр передаваемого сигнала ограничен узкой полосой пропускания радиотракта, речь кодируют по специальному алгоритму LCP-LTP-RPE-кодирования. Следует отметить, что GSM-кодирование оптимизировано исключительно для передачи речи с максимальным качеством...
|
|
|
|
12.10.2010, 21:11
|
|
Гражданин KAZUS.RU
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
|
Re: Вопрос из распознавания речи
Сообщение от lvadia
|
Какова скорость просмотра БД "неограниченного размера"?
|
Это не мои проблемы. Моё дело дать возможность, а как её используют мне по барабану.
|
|
|
|
12.10.2010, 21:12
|
|
Гражданин KAZUS.RU
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
|
Re: Вопрос из распознавания речи
Сообщение от you_go
|
а затем преобразуется в цифровой поток со скоростью 13 кбит/с
|
Нельзя ли подробнее? Или ссылку дайте на стандарт .
|
|
|
|
12.10.2010, 21:27
|
|
Гражданин KAZUS.RU
Регистрация: 30.05.2008
Адрес: Нижний Новгород
Сообщений: 903
Сказал спасибо: 90
Сказали Спасибо 1,276 раз(а) в 414 сообщении(ях)
|
Re: Вопрос из распознавания речи
Последний раз редактировалось you_go; 12.10.2010 в 21:35.
|
|
|
|
12.10.2010, 21:36
|
|
Гражданин KAZUS.RU
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
|
Re: Вопрос из распознавания речи
Сообщение от lvadia
|
Спасибо за честный ответ! Kurzwell отдыхает......................
|
Я же не оружие массового поражения делаю, что за придирки!
|
|
|
|
12.10.2010, 21:49
|
|
Гражданин KAZUS.RU
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
|
Re: Вопрос из распознавания речи
сам пока надыбал, что сигнал в стандартных вокодерах ИКМ 8кГц
|
|
|
|
Ваши права в разделе
|
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения
HTML код Выкл.
|
|
|
Часовой пояс GMT +4, время: 21:05.
|
|