Реклама на сайте English version  DatasheetsDatasheets

KAZUS.RU - Электронный портал. Принципиальные схемы, Datasheets, Форум по электронике

Новости электроники Новости Литература, электронные книги Литература Документация, даташиты Документация Поиск даташитов (datasheets)Поиск PDF
  От производителей
Новости поставщиков
В мире электроники

  Сборник статей
Электронные книги
FAQ по электронике

  Datasheets
Поиск SMD
Он-лайн справочник

Принципиальные схемы Схемы Каталоги программ, сайтов Каталоги Общение, форум Общение Ваш аккаунтАккаунт
  Каталог схем
Избранные схемы
FAQ по электронике
  Программы
Каталог сайтов
Производители электроники
  Форумы по электронике
Помощь проекту

Цифровые сигнальные процессоры Вопросы, связанные с применением цифровых сигнальных процессоров: программирование, отладочные средства, алгоритмы...

 
Опции темы
Непрочитано 12.10.2010, 20:40  
NikMih_1
Гражданин KAZUS.RU
 
Аватар для NikMih_1
 
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
NikMih_1 на пути к лучшему
По умолчанию Вопрос из распознавания речи

Практически восстановил работу 20 летней давности, сделал плату преобразования естественной речи, позволяющую в случае применения со стандартными программами распознавания речи комплектовать её словарём неограниченного размера. Остался финальный шаг, его я не сделал в своё время потому, что нынешних возможностей купить PIC или АVR не было.
Проблема в том, что я не знаю принципов выбора частоты дискретизации выходного сигнала с точки зрения СТАНДАРТОВ. Про теорему Котельникова я слыхал. У меня есть диктофон Олимпус с частотой дискретизации 22,5 кГц и полосой 300 - 7200Гц, его сигнал я использую как надо и далее следует вывод. Мой сигнал будет иметь полосу 300 - 4800Гц. Какую частоту дискретизации выбирать исходя из СТАНДАРТОВ?
Реклама:
NikMih_1 вне форума  
Непрочитано 12.10.2010, 20:47  
Nikopol
Вид на жительство
 
Аватар для Nikopol
 
Регистрация: 05.01.2007
Адрес: Украина, г. Макеевка
Сообщений: 408
Сказал спасибо: 229
Сказали Спасибо 62 раз(а) в 52 сообщении(ях)
Nikopol на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

Думаю правильным ответом в данной ситуации именно будет теорема Котельникова. При чем тут стандарты, в ПК собственно ей тоже пользуються, в смысле теоремой, частоту 44100 Гц тоже не с потолка взяли.

Хотя, если уж сильно охота влесть в стандарты, то думаю, Вам стоит смотреть в сторону звуковых файлов типа mp3 и wav
__________________

____________________________________________
Internet Explorer - это такая программа, с помощью которой можно зайти на сайт http://opera.com и скачать себе браузер...
Nikopol вне форума  
Непрочитано 12.10.2010, 20:49  
NikMih_1
Гражданин KAZUS.RU
 
Аватар для NikMih_1
 
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
NikMih_1 на пути к лучшему
Радость Re: Вопрос из распознавания речи

Сообщение от Nikopol Посмотреть сообщение
Думаю правильным ответом в данной ситуации именно будет теорема Котельникова. При чем тут стандарты, в ПК собственно ей тоже пользуються, в смысле теоремой, частоту 44100 Гц тоже не с потолка взяли.
Да я думаю об этом в связи с цифровой телефонией: вокодеры всякие и прочее. Думается лучше сразу зацепиться за какой-то стандарт. С точки зрения WAV следует делить 22,5 на 2 и будет 11,25, но годится ли это вокодерам? не придётся ли перекодировать и помехи создавать?

Последний раз редактировалось NikMih_1; 12.10.2010 в 20:55. Причина: Уточнение.
NikMih_1 вне форума  
Непрочитано 12.10.2010, 21:02  
Falconist
Супер-модератор
 
Аватар для Falconist
 
Регистрация: 08.09.2007
Адрес: Kyiv, Ukraine
Сообщений: 7,963
Сказал спасибо: 428
Сказали Спасибо 3,938 раз(а) в 1,690 сообщении(ях)
Falconist на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

Частотный диапазон речи со всеми своими формантами не так уж и велик. От 70 до 7000 Гц. По другим данным - 300-4000 Гц. Как видите, довольно большой разброс. Так что спокойно выбирайте удобный для Вас "стандарт" - и вперёд.
__________________
Выслушай и противную сторону, даже если она тебе и противна!..
Falconist на форуме  
Непрочитано 12.10.2010, 21:07  
you_go
Гражданин KAZUS.RU
 
Аватар для you_go
 
Регистрация: 30.05.2008
Адрес: Нижний Новгород
Сообщений: 903
Сказал спасибо: 90
Сказали Спасибо 1,276 раз(а) в 414 сообщении(ях)
you_go на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

Может, стоит ориентироваться на способы кодирования речи в сотовых телефонах:
...С микрофона речевой сигнал поступает в тракт передачи. Там он на первом этапе сегментируется (разбивается на сегменты длительностью 20 мс), а затем преобразуется в цифровой поток со скоростью 13 кбит/с (один сегмент составляет кодовую последовательность из 260 бит). Поскольку частотный спектр передаваемого сигнала ограничен узкой полосой пропускания радиотракта, речь кодируют по специальному алгоритму LCP-LTP-RPE-кодирования. Следует отметить, что GSM-кодирование оптимизировано исключительно для передачи речи с максимальным качеством...
you_go вне форума  
Непрочитано 12.10.2010, 21:11  
NikMih_1
Гражданин KAZUS.RU
 
Аватар для NikMih_1
 
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
NikMih_1 на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

Сообщение от lvadia Посмотреть сообщение
Какова скорость просмотра БД "неограниченного размера"?
Это не мои проблемы. Моё дело дать возможность, а как её используют мне по барабану.
NikMih_1 вне форума  
Непрочитано 12.10.2010, 21:12  
NikMih_1
Гражданин KAZUS.RU
 
Аватар для NikMih_1
 
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
NikMih_1 на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

Сообщение от you_go Посмотреть сообщение
а затем преобразуется в цифровой поток со скоростью 13 кбит/с
Нельзя ли подробнее? Или ссылку дайте на стандарт.
NikMih_1 вне форума  
Непрочитано 12.10.2010, 21:27  
you_go
Гражданин KAZUS.RU
 
Аватар для you_go
 
Регистрация: 30.05.2008
Адрес: Нижний Новгород
Сообщений: 903
Сказал спасибо: 90
Сказали Спасибо 1,276 раз(а) в 414 сообщении(ях)
you_go на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

Фактически быстрое преобразование Фурье
http://alex-bor2006.narod.ru/gsm/5_kod.htm
http://asterisk.ru/knowledgebase/GSM+Codec
http://www.baudline.com/solutions/codec/

Последний раз редактировалось you_go; 12.10.2010 в 21:35.
you_go вне форума  
Непрочитано 12.10.2010, 21:36  
NikMih_1
Гражданин KAZUS.RU
 
Аватар для NikMih_1
 
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
NikMih_1 на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

Сообщение от lvadia Посмотреть сообщение
Спасибо за честный ответ! Kurzwell отдыхает......................
Я же не оружие массового поражения делаю, что за придирки!
NikMih_1 вне форума  
Непрочитано 12.10.2010, 21:49  
NikMih_1
Гражданин KAZUS.RU
 
Аватар для NikMih_1
 
Регистрация: 25.02.2008
Сообщений: 997
Сказал спасибо: 223
Сказали Спасибо 72 раз(а) в 58 сообщении(ях)
NikMih_1 на пути к лучшему
По умолчанию Re: Вопрос из распознавания речи

сам пока надыбал, что сигнал в стандартных вокодерах ИКМ 8кГц
NikMih_1 вне форума  
 

Закладки
Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Интересный вопрос - два усилителя к одной нагрузке eCAH Аудиотехника 45 14.10.2010 01:23
Вопрос по блоку питания... El-Shang Источники питания и свет 13 19.11.2009 17:35
Вопрос По Tas5414a (Входной модуль) C-r-o-w Аудиотехника 0 08.11.2009 18:11
Вопрос про удаленное управление питанием ResolveR Автоматика и аппаратура связи 8 02.09.2008 08:57


Часовой пояс GMT +4, время: 21:05.


Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot