Создание интернет сайта туристической компании "Карта Мира"
       
     








Вы здесь: Главная Семантические технологии Семантическое распознавание речи и рукописного текста
   
 
Поиск
   
Главная
 
 
 
 




Распознавание речи и рукописного текста






При автоматизированном распознавании устной речи и рукописного текста на естественных языках возникают проблемы, близкие к проблемам машинного перевода.

То есть, существуют слова, близкие по звучанию, по набору фонем. Например, «шесть» и «шерсть» (рус.), ship and sheep в английском. Человек достаточно легко справляется с различением таких слов за счет понимания контекста, в котором они произнесены, тогда как для компьютерных систем различить такие близкие наборы звуков составляет почти неразрешимую задачу. Следовательно, для распознавания речи нужно не только слышать ее, но еще и понимать о чем идет речь. Человек однозначно воспринимает контекст и восстанавливает («домысливает») нерасслышанные фонемы, в то время как существующие алгоритмы этот контекст просто не учитывают.

Аналогичные проблемы возникают и при распознавании рукописного текста. То есть, вариации в написании символов различными людьми не дают возможности построить однозначное соответствие между рукописным символом и буквой алфавита, что не дает возможности точно построить то или иное слово по его рукописному аналогу.

Наличие эти проблем обусловлено опять же механистическим подходом к распознаванию фонем и символов –делается попытка распознать их как дискретные элементы, не учитывая семантических взаимосвязей.

Здесь, как и в задаче перевода, проблема распознавания решается отражением семантическое пространство для тех гипотез значений, которые наиболее вероятны для звучаний и написаний распознаваемых слов. Изначально рассматриваются все варианты слов, которые могут быть получены из распознанной информации. Так как отражение проводится вместе с предыдущим контекстом, то сразу можно выбрать то понятие, которое наиболее семантически близко к данному контексту и по нему ( если нужно) восстановить то слово, которое требуется распознать.

Одной из проблем современных систем распознавания является восстановление по распознанным фонемам исходного слова. Это связано с тем, что транскрипция ( произношение) каждого слова не обязательно совпадает с его написанием, например лесница, здача, салома и т.д.

Подход с позиций КТПП дает простое решение данной проблемы. Представляется наиболее целесообразным не искать способы написания того или иного набора фонем, а напрямую осуществлять поиск этого набора в ПП, так же как ищутся и слова с целью определения их координат. То есть, по набору фонем определяются координаты соответствующего понятия  и в сочетании с определением разрешенной/запрещенной области выдается решение о том или ином понятии уже в письменном, текстовом (или графическом) виде.

Преимущество такого подхода заключается еще и в том, что он позволяет реализовать клиент – серверную архитектуру обработки запроса, то есть распознавание фонем производить на достаточно «тонком» клиенте, а поиск соответствия набора фонем и понятия, производить на сервере – удаленном компьютере. Более того, если набор фонем из запроса не распознан на ближайшем распознающем сервере, то его можно при помощи глобальных телекоммуникационных сетей отослать другим серверам ( например, если запрос сделан на неиспользовавшемся ранее языке), то есть можно построить систему распознавания речи на нескольких (потенциально – на любых) языках.




Мы всегда рады Вашим вопросам!
А если Вы укажете свой электронный адрес и телефон, мы постараемся быстро и полно ответить на Ваш вопрос.

Ваш e-mail (обяз.):


Ваш телефон (необ.):


Ваш вопрос:



Мы всегда рады
Вашим вопросам!


Вы можете отправить вопрос через
форму внизу страницы,

или позвонить:
Москва:
+7(499)704-00-89
(многоканальный)
Бесплатный номер для звонков из регионов:
8-804-3333-080

бесплатно для Вас! (см..)

Через Skype: Skype Me™!
Добавь меня в Skype
В Хабаровске:
(4212) 62-99-09
Во Владивостоке:
(4232) 26-88-12








Холизм - философия Целостности

   
Подключайся!..

2001-2010
© Сумма технологий
Rambler's Top100