iOS 5: невероятные возможности голосового управления

Вся индустрия с замиранием сердца смотрела за презентацией Скотом Форсталлом 10 самых значимых функций пятой мобильной iOS-прошивки. Однако, ко всеобщему удивлению, на конференции ни слова не сказали про партнерство Apple и Nuance.

Как известно, компания Стива Джобса очень давно сотрудничает с Nuance Communication – одним из ключевых игроков на рынке решений для распознавания голоса и управления устройствами при помощи речи. И до сегодняшнего дня iOS не предлагает каких-либо расширенных возможностей по голосовому взаимодействию с пользователем.

Функция Управление голосом в текущей “яблочной” системе сильно ограничена в функционале и не имеет поддержки поиска. Google Android намного опережает Apple iOS в этом отношении благодаря разнообразию голосовых команд, реализованых на основе проприетарной технологии распознавания речи. Андроидфоны могут озвучивать текстовые сообщения, создавать e-mail под диктовку, осуществлять перевод на многие языки, находить местоположение на карте, изменять направление перемещения в какой-либо пункт.

Технологии искусственного интеллекта Siri должны идеально дополнить возможности следующего поколения мобильной операционной системы Apple. iOS 5 получит куда более серьезную голосовую поддержку, притом что распознавание речи может, к примеру, вестись непосредственно с домашнего экрана или по нажатии на клавишу пробел на виртуальной клавиатуре.

Известно, что в свое время Apple за 200 млн долларов купила компанию Siri, интеллектуального помощника, который должен наделить iPhone пвсевдоразумными функциями персонального ассистента, гида и секретаря, взаимодействие с которым осуществляется голосом на естественном языке. Некоторое время назад сайт TechCrunch писал:

Они (прим. разработки Siri) станут важнейшим компонентом iOS 5. Созданный Siri искусственный интеллект будет глубоко интегрирован в самые разные службы новой системы. По нашим сведениям, команде инженеров Apple осталось доделать последние штрихи. Технология будет открыта и сторонним разработчикам приложений.

Технология обещает действительно невероятные возможности. Достаточно вслух произнести что-то типа «Подбери-ка недалеко от дома ресторан, где я буду сегодня ужинать вдвоем. Кухня должна быть европейская, а место — романтическим», и Siri незамедлительно проведет семантический анализ фразы, разобьет ее на смысловые составляющие, сформирует правильный поисковый запрос, выдав в итоге список из подходящих мест. Определившись с выбором, легко заказать столик непосредственно в онлайне.

Аналогично Siri поможет купить билеты в кино, собраться в театр, покричать на стадионе, сходить в музей… Вообще можно сказать «Эй, а что это у нас сегодня делается?» — послушный робот соберет полную информацию о культурно-увеселительных мероприятиях города.

Что интересно, голосовые запросы Siri понимает на естественном языке, разумеется, английском. Фразы «Умираю, веки сами закрываются» и «Ой, кажется, я наклюкался» приведут к бронированию номера в отеле и вызову такси.

«Кто такой Стив Джобс?», «Сколько будет два плюс два умножить на два?», «Где все банкоматы?», «Какая нынче погода на дворе?» — за буквальными вопросами последуют не менее буквальные ответы.

Технологическая составляющая Siri опирается на функции распознавания речи Nuance и семантического анализа, разработанные в Стэнфордском НИИ по заказу Управления перспективных исследований и разработок Министерства обороны США. За фасадом Siri кроется недюжинный алгоритм, который по праву можно назвать матерью всех композитных веб-приложений, смешивающих данные из обилия различных веб-служб. Как ожидается, за подобными решениями лежит будущее мобильного Интернета.

Следите за новостями Apple в нашем Telegram-канале, а также в приложении MacDigger на iOS.

Присоединяйтесь к нам в Twitter, ВКонтакте, Facebook, Google+ или через RSS, чтобы быть в курсе последних новостей из мира Apple, Microsoft и Google.