Microsoft Speech Server и речевые технологии… О чем все разговоры?

Опубликовано: 25 Марта, 2023

Согласно Microsoft и ее планам в отношении технологий:



  • Клиенты получают коммерческую выгоду от развертывания речевых приложений на базе Microsoft
  • Партнеры создают успешные решения Microsoft Speech Server
  • Разработчики могут быстро и легко включать голосовые веб-приложения

Так что все это значит? Что ж, дни «говорящих компьютеров» почти наступили. Страшный? Нет, просто реальность. Технологии с поддержкой речи действительно существовали долгое время, но у них никогда не было той поддержки или той жизни, которую Microsoft пытается вдохнуть в них… и в этом есть смысл. Зачем печатать 9 часов, когда можно «говорить».


Председатель правления и главный архитектор программного обеспечения Билл Гейтс запустил Microsoft Speech Server 2004 и рассказал о возможностях для разработчиков и бизнес-ценности Speech Server, которая, по мнению аналитиков, изменит динамику отрасли.



Дефект речи?


Проблемы «Распознавания голоса и речи» часто являются причиной нечеткой артикуляции… Microsoft решает все возникающие проблемы по мере их поступления. Наиболее распространенными проблемами, которые преследовали все другие попытки создания систем на сегодняшний день, являются:



  • Он не стандартизирован, в основном проприетарный
  • Технологию было нелегко адаптировать или внедрить
  • Люди говорят по-разному, многие используют сленг, другой жаргон
  • Языковые барьеры
  • Проблемы с кодированием и программным обеспечением
  • Фоновый шум и изменение «звука», который принимает компьютер
  • Стандартные периферийные устройства ввода-вывода, простые в развертывании (мышь, клавиатура)
  • В настоящее время все еще находится в «нишевом» рынке

Преимущества расширенного распознавания речи


Microsoft открывает новые горизонты в речевой индустрии, став первой компанией, предлагающей единую платформу, сочетающую в себе:



  • Веб-технологии
  • Услуги обработки речи
  • Возможности телефонии

После того, как он откроется для разработчиков, откроется еще один рынок, поскольку поставщики начнут создавать «речевые» приложения. Разве ты не можешь просто увидеть это сейчас? Что вы хотите на праздники в следующем году, новую беспроводную клавиатуру или микрофон? Если это произойдет, вы можете предположить, что веб-интерфейс и все другие технологии также должны будут стандартизировать речевые технологии… это может создать новый способ работы и работы (банкоматы, киоски)… это может революционизировать то, как мы работаем не только в технике, но и в других областях. А что с инвалидом? Это также откроет для них новые порталы; Внедрение речевых технологий в доступные решения определенно вызовет какие-то изменения в ландшафте в следующие 10 лет, если они будут успешными. Спасибо за то, что вы идете на работу и имеете гарнитуру, с которой вы в основном бродите по мобильному телефону, а затем возвращаетесь домой в свой SOHO. Я не говорю, что это сегодняшнее решение, но, как и все остальное (Wireless и т. д.), это меня ничуть не удивит. Представьте себе телефоны, мобильные телефоны, карманные компьютеры, смартфоны, ноутбуки, ежевики и т. д., все они «распознают речь»?


Поставщики устройств безопасности и разработчики программного обеспечения безопасности также должны рассмотреть эту технологию.


Машины общаются как люди, Реальность?


Да. Поставщики работают над созданием «коммуникационных инструментов», которые позволят, например, преобразовать электронное письмо в голосовой разговор или наоборот. Домашние системы безопасности, подключенные к вашему ПК, могут включаться и выключаться вашим голосом, возможно, даже «только вашим голосом» из соображений безопасности. Как видите… все может (и будет) меняться по мере развития технологий. Все зависит (конечно) от того, насколько стабильна технология, сколько она стоит и так далее. Также в этом году была опубликована информация о шаге Microsoft по обновлению XBOX, кто хочет поспорить с ее достижениями в «игровом» пространстве, без сомнения, Microsoft попытается захватить телефон и все другие вещи в доме. Это переводит почти все в вашем доме в состояние «возможной конвергенции». Речевые технологии могут быть очень крутыми, когда ваш XBOX — единственный в квартале, с которым вы тоже можете «говорить». Не знаю, как вы, а я не могу дождаться, когда мои видеоигры начнут со мной разговаривать, тогда, может быть, XBOX может стать нашей следующей игрой с виртуальной реальностью, поскольку Microsoft также делает перемещение в космос на телевизоре и так далее.


О большинстве этих вещей я немного размышляю, но благодаря моему чрезмерно живому воображению и проверке некоторых источников можно с уверенностью сказать, что все эти вещи, вероятно, находятся в разработке или находятся на стадии разработки.


Кто еще говорит?


Другие также находятся на рынке речи. IBM — еще один крупный игрок, уже работающий с речевыми технологиями. IBM также надеется стать крупным игроком на этой арене и планирует выпускать предложения до конца этого десятилетия. Одним из таких приложений является «Компьютерные киоски», которые помогают переводить с одного языка и находятся в стадии разработки, пока мы говорим (без каламбура).


Резюме


В этой статье мы рассмотрели «Речевые» службы и технологии Microsoft, которые появятся в этом году и продолжат расти (надеюсь) быстро, поскольку это стоящая технология, которая действительно делает жизнь «легче», что, по сути, обеспечивает больше качественного времени.. Говорить вместо того, чтобы печатать, сократит ваш день. Речевые технологии кажутся беспроигрышным решением… вы не согласны? Давайте послушаем, что вы думаете на форуме?


В следующих статьях (поскольку мы будем проводить бета-тестирование Speech Server 2004) вы узнаете о технических тонкостях. Следите за нашей следующей статьей, а пока загляните внутрь речевых технологий, чтобы увидеть, как все это работает.


Наша следующая статья о речи будет посвящена VoiceXML; xHTML и SALT, что означает теги языка речевых приложений. В следующей статье будет рассказано об установке и настройке Speech Server, а также о том, как его использовать.


Следите за обновлениями.


Ссылки и ссылки


Выступление Главная
http://www.microsoft.com/speech/


Форма заказа оценочного комплекта
http://www.microsoft.com/speech/HowToBuy/evaluationkit/default.asp


Стартовый комплект
http://www.microsoft.com/speech/HowToBuy/starterkit/default.asp


Microsoft воплощает в жизнь концепцию основных речевых технологий с выпуском Microsoft Speech Server 2004
http://www.microsoft.com/presspass/press/2004/mar04/03-24SpeechServer04LaunchPR.asp


(Сравнение) Распознавание речи Apple
http://www.apple.com/macosx/features/speech/