Google ставит на технологии синтеза речи

В фантастических фильмах часто приходится видеть, как люди управляет компьютером речью, отдавая голосовые команды и получая такие же ответы. Этот способ взаимодействия человека с электроникой уже применяется сегодня, но далёк от совершенства. Многие компании, включая таких гигантов как Microsoft, работают в направлении улучшения качества голосового распознавания речи (о точном анализе сложных голосовых команд пока говорить не приходится) и воспроизведения компьютером текстовых файлов. Сегодня пользователи могут набирать тексты голосом, отдавать простейшие команды операционной системе и слушать аудиокниги, воспроизведённые с текста (подобная функция реализована даже в некоторых электронных книгах). Однако для достижения поставленной задачи, тем более для всех распространённых мировых языков, исследователям и разработчикам предстоит преодолеть ещё множество трудностей.

Phonetic Arts Google ставит на технологии синтеза речи

Молодая компания Phonetic Arts, основанная в конце 2006 года в Кембридже и насчитывающая сегодня 14 сотрудников, хорошо себя зарекомендовала и заинтересовала такую крупную IT-компанию, как Google. Она разрабатывает комплексное программное обеспечение для синтеза речи, включающее разнообразные инструменты для создания голосовой матрицы, озвучивания текста и получения результирующего звукового файла. В основном её решения применяются в сфере компьютерных игр. В списке сотрудничающих с Phonetic Arts присутствуют издатели Sony Computer Entertainment, SEGA, EA Sports, игровые студии DICE, Bethesda и другие.

На днях было подписано соглашение о вхождении Phonetic Arts в состав Google. На официальном сайте компании по этому поводу сказано следующее: «Мы рады сообщить, что Phonetic Arts была приобретена Google. Мы хотим поблагодарить всех за огромную поддержку и содействие в нашем развитии. Синтез речи — это чрезвычайно захватывающая область технологий, и мы много работали, чтобы принести передовые инновации на рынок. Мы видим большие возможности по интеграции наших технологий в продукты Google и хотели бы стать частью лучшей в мире речевой команды».

voice Google ставит на технологии синтеза речи

Недавно компания Google сделала несколько важных шагов в продвижении голосовых технологий и инструментов, запустив голосовой поиск, речевой ввод и голосовые команды для мобильных телефонов под управлением Android, iOS и Symbian. В результате пользователи ряда смартфонов получили возможность осуществления разнообразных сложных поисковых запросов без нажатия клавиш, набора сообщений и текста с помощью голоса, а также управления многими мультимедийными функциями. Интересно, что есть поддержка и русского языка.

hero Google ставит на технологии синтеза речи

В прошлом году Google добавила в службу YouTube функцию автоматической транскрипции английской речи, которая в отдельных случаях неплохо справляется со своей задачей. Однако качество поддержки речи отличной от английской очень плачевно. И если распознавание довольно сложно оценить, то дать характеристику точности произношения сможет каждый. Ярким примером тому может служить служба Google Translate, способная озвучить сделанный перевод. Компания признаёт, что в этом направлении работы — непочатый край. Вот почему Google и приобрела Phonetic Arts, оценив её как «команду исследователей и инженеров, которые работают над превосходным синтезом речи, предоставляя технологию, моделирующую естественную компьютерную речь из небольших образцов записанного голоса».

Google Nexus One Voice Search Input Google ставит на технологии синтеза речи

Google уже имеет центр разработок в Лондоне и намерена присоединить к ней команду Phonetic Arts, технологией которой она впечатлена. Компания пока не раскрывает своих планов по использованию новой интеллектуальной собственности, однако обещает, что будущее будет приближаться немного быстрее.

источник

Аналитика |  Компании |  Технологии Добавить новый комментарий | 1 комментарий

1 комментарий

  • julia говорит:

    Голосовой поиск, основанный на облаках, работает очень хорошо. Думаю, и с синтезом у них все получится.
    Только быстрее бы в России этот сервис внедрили. Надо и наш рынок высоких технологий ближе к широким массам делать. От этого и конечным пользователям и участниками рынка будет только лучше.

    Запись сделана в 17:22 07/12/2010