Всё об «Алисе»: на что способен голосовой помощник от «Яндекс»? «Алиса» — новый голосовой помощник

Всё об «Алисе»: на что способен голосовой помощник от «Яндекс»? «Алиса» — новый голосовой помощник

24.08.2019

Друзья, в октябре выполняется 3 года со дня официального выпуска Windows 10, а интегрированный в операционную систему голосовой помощник Кортана всё никак не научится говорить по-русски. До сих пор штатный виртуальный ассистент доступен лишь для 15 стран мира, куда государства постсоветского пространства не входят. Благо, в России назрел ответ западным IT-разработкам. Теперь, ребята, у нас есть отечественный голосовой помощник, который может внедряться не только в мобильные устройства, но также в Windows-компьютеры, и зовут её Алиса. Что же, друзья, давайте с ней знакомиться.

«Окей, Яндекс» вместо Кортаны

Решить проблему Кортаны 2 года назад взялся первый поисковик Рунета Яндекс и предложил русскоязычной аудитории бесплатную утилиту Яндекс.Строка, интегрирующую в панель задач Windows аналог Кортаны – поисковик с возможностью ввода голосовых команд. Яндекс.Строка создавалась прежде всего в поддержку сервисов Яндекса. В число её возможностей входили внутристенный поиск, поиск в Интернете, получение прямо в поисковой строке ответов на простые вопросы типа погоды или конвертации величин. Активировать утилиту можно было голосовым запросом «Слушай, Яндекс» или «Окей, Яндекс».

Особого впечатления на русскоязычную аудиторию Яндекс.Строка не произвела, и её создатели пришли к выводу, что проблема заключается в безликости голосового помощника. Проанализировав ошибки, компания Яндекс недавно привела утилиту к новому формату: в ней улучшен функционал и появился виртуальный персонаж по имени Алиса. Саму же обновлённую Яндекс.Строку переименовали, назвав просто и незатейливо – «Голосовой помощник для Windows». Алиса доступна не только для Windows, но также для мобильных устройств на базе iOS и Android. В скором времени планируется внедрение Алисы в Яндекс.Браузер и другие продукты первого поисковика Рунета.

Как работает Алиса

Алиса внедряется в панель задач Windows и подменяет собой штатный внутрисистемный поиск. При клике на поисковую строку в панели задач после внедрения утилиты увидим подборку иконок избранных сайтов, извлечённых из истории браузера, популярные поисковые запросы, а также кнопки взаимодействия с Алисой.

Активировать виртуальную помощницу можно кликом по значку микрофона, а также фразами – как старыми, что использовались для Яндекс.Строки, так и новыми - «Окей, Алиса», «Привет, Алиса», «Слушай, Алиса». Кнопка со значком вопроса выведет справочную информацию о её возможностях.

Как и штатный внутрисистемный поиск Windows 10, поисковой инструмент от Яндекса структурирован разделами. В разделе ниже обнаружим некий аналог меню «Пуск» с подборкой штатных программ Windows.

А в последнем разделе получим доступ к папкам пользовательского профиля.

Ну а теперь о сути – на что способна Алиса? Голосовая помощница от Яндекса может:

Заходить на известные сайты;

Запускать некоторые программы Windows;

Открывать запрашиваемую музыку на сервисах Яндекс.Музыка и Яндекс.Радио;

Выдавать прямо в чате ответы на точные вопросы по типу возможностей умной строки Яндекса;

Выключать, перезагружать и отправлять в сон компьютер;

Выдавать прямо в чате погоду, время, дату, новости, конвертированные деньги и прочие величины, информацию о городских пробках и общественных заведениях;

Прокладывать маршруты;

Формировать поисковые запросы и перенаправлять их в браузер.

Серьёзного разговора с Алисой, конечно, не получится.

При любом перевесе её возможностей виртуальная ассистентка тотчас же отправит нас в веб-поисковик. Она пока ещё многого не умеет, чему уже обучилась Кортана – запускать будильник и таймер, планировать что-то и создавать заметки в записной книжке и т.п.

Плюс к этому, детище Яндекса не всегда корректно распознаёт голосовые запросы, запускает не все программы, не обнаруживает местоположение пользователя на Windows-устройствах без GPS. Тем не мене разработчики строят насчёт новой голосовой помощницы грандиозные планы. Её проект настолько серьёзен, что сотрудники Яндекса его в числе ключевых IT-наработок продемонстрировали президенту РФ Владимиру Путину во время его визита в компанию. При тестировании Владимир Владимирович традиционно для своего амплуа спросил у ассистентки: «Тебя здесь не обижают?»

Кто такая Алиса?

Озвучила Алису известная актриса Татьяна Шитова. Именно её голос использован в голосовом движке, посредством которого виртуальная помощница общается с пользователями. Алиса – персонаж со своим характером. Изначально в компании Яндекс её планировали сделать благородной девицей, загрузив в её словарный запас литературную терминологию. Но когда поняли, что таким образом сделали ассистентку чрезмерно уж скучной, систему словарного запаса взяли из Twitter. В итоге Алиса получилась как остроумный подросток: она умеет дерзить и даже хамить на неугодные ей темы, наделена чувством юмора и импровизирует с учётом контекста заданных вопросов.


Настройки Алисы

Алиса - не во многом, но настраиваемый инструмент. Иконки сайтов на панели быстрого доступа можно сменить на другие из числа сервисов Яндекса, часто посещаемых или недавно посещённых сайтов. Также для утилиты можно:

Настроить операции с файлами – их открытие в программе или в папке проводника;

Разделить поисковой инструмент Яндекса и чат общения с Алисой двумя отдельными кнопками на панели задач Windows;

Выбрать браузер для открытия результатов поиска.

Здравствуйте друзья! Многим читателям непонятно, что означает Алиса, Яндекс помощник для Windows. В этой статье будет дан ответ на этот вопрос. Речь пойдет о голосовом помощнике для ПК и телефонов, о помощнике Яндекса Алисе. Голосовой поиск Yandex осуществляется через отдельно установленное приложение. Мы разберемся, как его установить и как им пользоваться.

Алиса, Яндекс помощник для Windows

Думаю, многим знакомо выражение Гугл окей, как проехать туда-то, или сколько стоит такой-то автомобиль. Такой функционал называется голосовой помощник Google, многие люди им пользуются и довольны этим. Гугл Вам даст ответ на большинство задаваемых вопросов. Сегодня Яндекс создал альтернативную систему распознавания речи, которая называется Алиса, Яндекс помощник для Windows. Хотя это не совсем точно, он создал такое приложение и для Андроида и для iOS. Но в этой статье мы рассмотрим Алису для Windows. Если Вы занимаетесь вопросами заработка через Интернет, то данный ассистент Вам поможет тоже.

Итак, что умеет делать приложение Алиса для Windows, как впрочем, и приложения для мобильных устройств. Вы подаете Яндексу команду голосом, и он отвечает на Ваши вопросы приятным женским голосом. Настолько мне известно, программа говорит голосом Татьяны Шитовой, скажу Вам, приятный голос у этой актрисы. Официально Alisa, помощник Яндекс была представлена всего четыре недели назад, точнее 10 октября 2017 года.

Поскольку функции программы одинаковые, что для мобильных устройств, что для стационарных компьютеров, ноутбуков, то в статье буду показывать только Алису для Windows. Если сравнивать ассистент Гугла и новый ассистент Яндекса, то наш сервис говорит гораздо лучше на русском языке, у него нет проблем с произношением и интонацией. Программа понимает даже половину слова, а также может понять не законченные вопросы.

Кроме распознавания устной речи, текст запроса и ответа публикуется в письменном виде. Надо сказать, что ассистент создан на базе нейронных сетей, а это значит, что Алиса будет постоянно самообучаться и становиться все умнее и умнее. Голосовой помощник создан на платформе известного синтезатора речи SpeechKit, помните, я писал об этом в статье « ».

Итак, что умеет Алиса, Яндекс помощник для Windows? Оказывается много. Например, Алиса, голосовой помощник Яндекса может с Вами просто поболтать на любую тему, согласитесь, интересная игрушка! Она расскажет, какая сейчас погода и как нужно сегодня одеться. Ответит на любой справочный вопрос, как доехать до аэропорта или где купить нужную вещь.

Алиса, может открыть Вам на компьютере социальную сеть ВКонтакте или нужный для Вас сайт, может открыть нужную Вам программу или Skype. Может включить перезагрузку компьютера, поможет найти нужную музыку или посчитать деньги, может проложить маршрут. Вы можете быстро узнать о пробках в Вашем городе, можете узнать свежие новости и многое другое. Отзывов о голосовом помощнике Алисе сегодня не так много, но пишут, что этот инструмент гораздо круче Гугловского ассистента. Кстати, В. Путин был в гостях у Яндекса и лично знакомился с этой разработкой. Теперь давайте посмотрим, как устанавливается Алиса, Яндекс помощник для Windows на компьютер.

Как скачать голосовой помощник Алиса?

Скачать голосовой помощник Алиса достаточно просто, все действия подробно показаны в представленном ниже видео. Для начала нам нужно набрать в поисковой строке Яндекса «голосовой помощник алиса», далее выбираем предложенные нам сайты. Если выберите адрес alice.yandex.ru , то Вы попадете на страницу для скачивания приложений для мобильных устройств – сможете скачать голосовой помощник Алиса от Яндекс на андроид или iOS. Если перейдете по адресу alice.yandex.ru›windows , то скачаете приложение для Windows.

Однако нужно иметь в виду, что Алиса, Яндекс помощник для Windows будет работать только с Windows 7 или 10. Далее нужно скачать саму программу к себе на компьютер, она весит всего 13 Мбайт. После этого устанавливаете, делается все просто и никаких дополнительных знаний не надо. На этом работа закончена, пора начинать пользоваться.

Привет Алиса, как дела?

Теперь у Вас в нижней части экрана монитора появится поле с надписью: «Поиск в Яндексе и на компьютере». Чтобы вызвать Алису, Вам нужно в этом поле нажать мышкой на изображение микрофона. Открывается рабочее окно программы. После установки программы, её работу можно начать со слов: «Привет Алиса, как дела». Чтобы лучше понять, как работает ассистент, нужно нажать на вопросительный знак окна.

У Вас откроется меню программы, и Вы сможете выбрать, нужную функцию, либо сможете начать задавать вопросы. Алиса, Яндекс помощник для Windows с удовольствием ответит на них. Не стесняйтесь, вопросы Вы можете задавать любые. Больше писать собственно не о чем, просто нужно брать и общаться. В процессе общения в окне программы пишется текст вопросов и ответов, которые можно также прочитать.

Заключение

Итак, Вы можете скачать голосовой помощник Alisa для любого устройства и активно начать им пользоваться. Особенно это будет удобно делать с помощью мобильных устройств. Ведь на стационарных компьютерах получить справочную информацию можно с помощью обычных сайтов.

Но опять же, нужно тратить время на чтение информации, а здесь можно делать свое дело, а параллельно слушать справочную информацию. Думаю, это дело каждого, как распорядиться этим ресурсом. Надеюсь, этот материал был для Вас полезным. Делитесь им в социальных сетях, пусть об Alisa узнают многие пользователи Интернета. Удачи Вам!

Получайте новые статьи блога прямо себе на почту. Заполните форму, нажмите кнопку "Подписаться"

Всем привет, мои дорогие друзья и гости моего блога. Наверняка, вы уже знаете, что такое Яндекс Алиса или по крайней мере слышали об этом. Алиса — голосовой помощник яндекса для мобильных устройств, который, по заявлению разработчиков, должен будет превзойти Siri от Apple и прочие аналоги.

Скажите пожалуйста, какими поисковыми системами вы пользуетесь? Наверняка ваш ответ будет Яндекс или Гугл. В России на данный момент пока с небольшим отрывом лидирует Яндекс, но с каждым годом Гугл становится все ближе к нему. А с учетом того, что у пользователей смартфонов на базе Android стоит по умолчанию браузер Google Crome, где поисковиком по умолчанию является сами знаете кто, то Яше осталось недолго держать пальму первенства в России. Тогда ребята из Яндекс решают как-то привлечь пользователей на свою сторону, создав нового голосового помощника.

Как говорят разработчики, их продукт по всем параметрам обходят зарубежный Google Assistant. Нет, конечно гугл ассистент очень классная штука, но с русским языком у него пока туговато.

Алиса была представлена широкой аудитории неделю назад, то есть 10 октября 2017 года. Воспользоваться этим решением смогут воспользоваться как владельцы Android, так и владельцы айфонов. В Windows с этим пока напряженка, но тем не менее вы можете пользоваться приложением в бета-режиме. Думаю, что скоро все наладится.

Какие функции выполняет Яндекс Алиса?

Вот список некоторых функций, которые на сегодняшний момент доступны:

  • Голосовой оиск в системе Яндекс
  • Прогноз погоды
  • Адреса различных заведений, кинотеатров, кафе и т.д.
  • Запуск установленных приложений, например Инстаграм или ВК (список будет расширяться)
  • Пробки и маршруты
  • Диалог для развлечения (об этом подробнее я расскажу ниже)

Чтобы воспользоваться одной из перечисленных функций, вам достаточно лишь спросить об этом. При этом, благодаря технологии распознавания речи SpeechKit, Алиса сама улавливает смысл сказанного, так что не нужны какие-то точные фразы для определения ваших потребностей. Например, вместо произнесения фразы «Ближайшее кафе» можно сказать что-нибудь типа «Где здесь можно пожрать?» , и она вам с удовольствием ответит.

Как и где скачать Алису?

Этот замечательный голосовой помощник призван облегчить жизнь мобильным пользователям, поэтому он одинаково подходит как для Apple, так и для Android. И так как приложение вполне себе официальное, то вы с легкостью найдете его в специализированных репозиториях в зависимости от вашей операционной системы, то бишь Playmarket для Android и AppStore для айфонов.

В общем суть вы поняли. Вам осталось лишь забить в поиске вышеуказанных сервисов необходимое слово, ну а дальше дело техники, как говориться. Приложение абсолютно бесплатное, так что здесь никаких проблем не будет.

Как пользоваться голосовым помощником Алиса от Яндекса?

На самом деле тут ничего сложного нет. Вам лишь нужно зайти в скачанное вами ранее приложение, открыть его, после чего нажать на значок микровона, либо сказать «Привет, Алиса». Тут же с вами поздоровается приятный женский голос с акцентом робота. По секрету я вам скажу, что этим голосом разговаривает Скарлетт Йохансон в российском дубляже, которую озвучивает актриса дубляжа Татьяна Шитова.

Помощница покажет вам свои возможности, ну а вы можете задать ей интересующие вас вопросы, например «Какая погода будет завтра» , или «Расскажи мне про фильм Дикари» , «Сколько живут белые медведи» и т.д.

Но кроме этого с ней можно даже поговорить на простые отвлеченные темы. У нее даже есть любимые фильмы и музыка, если вы ее спросите.

Дошло даже до того, что я позвал ее на свидание и предложил ей «руку и сердце». Вы обо мне плохого не подумайте. С головой всё нормально. Просто интересно посмотреть ее реакцию на подобные темы.

Но иногда она даже умеет обижаться и заканчивать беседу. Прям жалко ее становится).

Конечно, она еще сыровата, на многие вопросы отвечает некорректно, но я думаю, что в будущем разработчики поправят эту фишку. Кроме того, предполагается, что позже система будет и обучаться, запоминая ваши действия. Таким образом она сможет превратиться в будущем в полноценного собеседника. Вы только главное не заигрывайтесь, а то вдруг и правда влюбитесь).

Итог

В общем, несмотря на то, что приложение еще пока сыроватое, оно уже активно вводится в эксплуатацию пользователями. Глядишь, скоро оно реально станет полноценным голосовым помощником, без которого вы и правда не будете представлять своей жизни. Поживем — увидим.

Ну а на этом я с вами буду прощаться. Скачивайте, устанавливайте и тестируйте Алису. Думаю, что вам понравится. Ну а если вы до сих пор не подписаны на обновления моего блога, то настоятельно рекомендую вам это сделать, чтобы не пропустить действительно чего-нибудь интересного. Удачи вам! Пока-пока.

С уважением, Дмитрий Костин

  • Машинное обучение ,
  • Поисковые технологии ,
  • Разработка мобильных приложений
  • В будущем, как нам кажется, люди будут взаимодействовать с устройствами с помощью голоса. Уже сейчас приложения распознают точные голосовые команды, заложенные в них разработчиками, но с развитием технологий искусственного интеллекта они научатся понимать смысл произвольных фраз и даже поддерживать разговор на любые темы. Сегодня мы расскажем читателям Хабра о том, как мы приближаем это будущее на примере Алисы – первого голосового помощника, который не ограничивается набором заранее заданных ответов и использует для общения нейронные сети.

    Несмотря на кажущуюся простоту, голосовой помощник – один из самых масштабных технологических проектов Яндекса. Из этого поста вы узнаете, с какими сложностями сталкиваются разработчики голосовых интерфейсов, кто на самом деле пишет ответы для виртуальных помощников, и что общего у Алисы с искусственным интеллектом из фильма «Она».

    На заре своего существования компьютеры в основном применялись на крупных научных или оборонных предприятиях. Про голосовое управление тогда размышляли лишь фантасты, а в реальности операторы загружали программы и данные с помощью куска картона. Не самый удобный способ: одна ошибка, и все нужно начинать сначала.

    С годами компьютеры становятся доступнее и начинают применяться в компаниях поменьше. Специалисты управляют ими с помощью текстовых команд, вводимых в терминале. Хороший, надежный способ – он применяется в профессиональной среде и по сей день, но требует подготовки. Поэтому когда компьютеры стали появляться в домах обычных пользователей, инженеры принялись искать более простые способы взаимодействия машины и человека.

    В лаборатории компании Xerox зарождается концепция графического интерфейса WIMP (Windows, Icons, Menus, Point-n-Click) – массовое применение она нашла в продуктах уже других компаний. Заучивать текстовые команды для управления домашним компьютером больше не требовалось - им на смену пришли жесты и клики мышью. Для своего времени это было настоящей революцией. И теперь мир приближается к следующей.

    Теперь почти у каждого в кармане лежит смартфон, вычислительных мощностей которого достаточно, чтобы посадить корабль на Луну. Мышь и клавиатуру заменили пальцы, но ими мы совершаем все те же жесты и клики. Это удобно делать, сидя на диване, но не в дороге или на ходу. В прошлом для взаимодействия с компьютерными интерфейсами человеку приходилось осваивать язык машин. Мы верим, что сейчас пришло время научить устройства и приложения общаться на языке людей. Именно эта идея легла в основу голосового помощника Алиса.

    У Алисы можно спросить [Где поблизости выпить кофе?], а не диктовать что-то вроде [кофейня улица космонавтов]. Алиса заглянет в Яндекс и предложит подходящее место, а на вопрос [Отлично, а как туда пройти?] - даст ссылку на уже построенный маршрут в Яндекс.Картах. Она умеет отличать точные фактовые вопросы от желания увидеть классическую поисковую выдачу, хамство – от вежливой просьбы, команду открыть сайт – от желания просто поболтать.

    Может даже показаться, что где-то в облаке работает нейронная чудо-сеть, которая в одиночку решает любые задачи. Но в реальности за любым ответом Алисы скрывается целая цепочка технологических задач, решать которые мы учимся уже 5 лет. И начнем мы свой экскурс с самого первого звена – со способности слушать.

    Привет, Алиса

    Искусственный интеллект из научной фантастики умеет слушать – людям не приходится нажимать на специальные кнопки, чтобы включить «режим записи». А для этого нужна голосовая активация – приложение должно понимать, что человек к нему обращается. Сделать это не так легко, как может показаться.

    Если вы просто начнете записывать и обрабатывать на сервере весь входящий звуковой поток, то очень быстро разрядите батарейку устройства и потратите весь мобильный трафик. В нашем случае это решается с помощью специальной нейронной сети, которая обучена исключительно на распознавание ключевых фраз («Привет, Алиса», «Слушай, Яндекс» и некоторых других). Поддержка ограниченного числа таких фраз позволяет выполнять эту работу локально и без обращения к серверу.

    Если сеть обучается понимать лишь несколько фраз, вы могли бы подумать, что сделать это достаточно просто и быстро. Но нет. Люди произносят фразы далеко не в идеальных условиях, а в окружении совершенно непредсказуемого шума. Да и голоса у всех разные. Поэтому для понимания лишь одной фразы необходимы тысячи обучающих записей.

    Даже небольшая локальная нейронная сеть потребляет ресурсы: нельзя просто взять и начать обрабатывать весь поток с микрофона. Поэтому на передовой применяется менее тяжеловесный алгоритм, который дешево и быстро распознает событие «началась речь». Именно он включает нейросетевой движок распознавания ключевых фраз, который в свою очередь запускает самую тяжелую часть – распознавание речи.

    Если для обучения лишь одной фразе необходимы тысячи примеров, то вы можете себе представить, насколько трудоемко обучить нейросеть распознаванию любых слов и фраз. По этой же причине распознавание выполняется в облаке, куда передается звуковой поток, и откуда возвращаются уже готовые ответы. Точность ответов напрямую зависит от качества распознавания. Именно поэтому главный вызов – научиться распознавать речь настолько же качественно, насколько это делает человек. Кстати, люди тоже совершают ошибки. Считается, что человек распознает 96-98% речи (метрика WER). Нам удалось добиться точности в 89-95%, что уже не только сопоставимо с уровнем живого собеседника, но и уникально для русского языка.

    Но даже идеально преобразованная в текст речь ничего не будет значить, если мы не сможем понять смысл сказанного.

    Какая погода завтра в Питере?

    Если вы хотите, чтобы ваше приложение выводило прогноз погоды в ответ на голосовой запрос [погода], то здесь все просто – сравниваете распознанный текст со словом «погода» и если получаете совпадение, выводите ответ. И это очень примитивный способ взаимодействия, потому что в реальной жизни люди задают вопросы иначе. Человек может спросить у помощника [Какая погода завтра в Питере?], и тот не должен растеряться.

    Первое, что делает Алиса при получении вопроса, это распознает сценарий. Отправить запрос в поиск и показать классическую выдачу с 10 результатами? Поискать один точный ответ и сразу выдать его пользователю? Совершить действие, например открыть сайт? А, может, просто поговорить? Невероятно сложно научить машину безошибочно распознавать сценарии поведения. И любая ошибка здесь малоприятна. К счастью, у нас есть вся мощь поисковой машины Яндекса, которая каждый день сталкивается с миллионами запросов, ищет миллионы ответов и учится понимать, какие из них хорошие, а какие – нет. Это огромная база знаний, на основе которых можно обучить еще одну нейронную сеть – такую, которая бы с высокой вероятностью «понимала», чего именно хочет человек. Ошибки, конечно же, неизбежны, но их совершают и люди.

    С помощью машинного обучения Алиса «понимает», что фраза [Какая погода завтра в Питере?] – это запрос погоды (кстати, это заведомо простой пример для наглядности). Но о каком городе идет речь? На какую дату? Здесь начинается этап извлечения из пользовательских реплик именованных объектов (Named Entity Recognition). В нашем случае важную информацию несут два таких объекта: «Питер» и «завтра». И Алиса, у которой за плечами стоят поисковые технологии, «понимает», что «Питер» – синоним «Санкт-Петербурга», а «завтра» – «текущая дата + 1».

    Естественный язык – не только внешняя форма наших реплик, но и их связность. В жизни мы не обмениваемся короткими фразами, а ведем диалог – он невозможен, если не помнить контекст. Алиса его помнит – это помогает ей разбираться со сложными лингвистическими явлениями: например, справляться с эллипсисом (восстанавливать пропущенные слова) или разрешать кореференции (определять объект по местоимению). Так, если спросить [Где находится Эльбрус?], а потом уточнить [А какая у него высота?], то помощник в обоих случаях найдет верные ответы. А если после запроса [Какая погода сегодня?] спросить [А завтра?], Алиса поймет, что это продолжение диалога про погоду.

    И кое-что еще. Помощник должен не только понимать естественный язык, но и уметь говорить на нем – как человек, а не как робот. Для Алисы мы синтезируем голос, в оригинале принадлежащий актрисе дубляжа Татьяне Шитовой (официальный голос Скарлетт Йоханссон в России). Она озвучивала искусственный интеллект в фильме «Она» , хотя вы могли запомнить ее и по озвучке чародейки Йеннифэр в «Ведьмаке». Причем речь идет о достаточно глубоком синтезе с применением нейронных сетей, а не о нарезке готовых фраз – записать все их многообразие заранее невозможно.

    Выше мы описали особенности естественного общения (непредсказуемая форма реплик, отсутствующие слова, местоимения, ошибки, шум, голос), с которыми нужно уметь работать. Но у живого общения есть еще одно свойство – мы далеко не всегда требуем от собеседника конкретного ответа или действия, иногда нам просто хочется поговорить. Если приложение будет отправлять такие запросы в поиск, то вся магия разрушится. Именно поэтому популярные голосовые ассистенты используют базу редакторских ответов на популярные фразы и вопросы. Но мы пошли еще дальше.

    А поболтать?

    Мы научили машину отвечать на наши вопросы, вести диалог в контексте определённых сценариев и решать задачи пользователя. Это хорошо, но можно ли сделать ее менее бездушной и наделить человеческими свойствами: дать ей имя, научить рассказывать о себе, поддерживать разговор на свободные темы?

    В индустрии голосовых помощников эта задача решается с помощью редакторских ответов. Специальная команда авторов берет сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответов на каждый. В идеале это нужно делать в едином стиле, чтобы из всех ответов складывалась цельная личность помощника. Для Алисы мы тоже пишем ответы – но у нас есть кое-что еще. Кое-что особенное.

    Помимо топа популярных вопросов существует длинный хвост из низкочастотных или даже уникальных фраз, на которые заранее подготовить ответ невозможно. Вы уже догадались, с помощью чего мы решаем эту проблему, не так ли? С помощью еще одной нейросетевой модели. Для ответов на неизвестные ей вопросы и реплики Алиса использует нейросеть, обученную на огромной базе текстов из интернета, книг и фильмов. Знатоков машинного обучения, возможно, заинтересует то, что начинали мы с 3-слойной нейронной сети, а теперь экспериментируем с огромной 120-слойной. Детали прибережем для специализированных постов, а здесь скажем, что уже текущая версия Алисы старается отвечать на произвольные фразы с помощью «нейросетевой болталки» – так мы ее называем внутри.

    Алиса учится на огромном количестве самых разных текстов, в которых люди и персонажи далеко не всегда ведут себя вежливо. Нейросеть может научиться совсем не тому, чему мы хотим ее научить.

    – Закажи мне сэндвич.
    – Обойдетесь.

    Как и любого ребенка, Алису нельзя научить не хамить, ограждая ее от всех проявлений хамства и агрессии – то есть обучая нейросеть на «чистой» базе, где нет грубостей, провокаций и прочих неприятных вещей, часто встречающихся в реальном мире. Если Алиса не будет знать о существовании подобных выражений, она будет отвечать на них бездумно, случайными фразами – для неё они останутся неизвестными словами. Пусть лучше она знает, что это такое – и выработает определённую позицию по этим вопросам. Если ты знаешь, что такое мат, ты можешь либо ругнуться в ответ, либо сказать, что не станешь разговаривать с ругающимся. И мы моделируем поведение Алисы так, чтобы она выбирала второй вариант.

    Бывает так, что сама по себе реплика Алисы вполне нейтральна, но вот в контексте, заданном пользователем, ответ перестаёт быть безобидным. Однажды, еще во время закрытого тестирования, мы попросили пользователя найти какие-то заведения – кафе или что-то подобное. Он сказал: «Найди другое такое же». И в этот момент в Алисе случился баг, и она вместо запуска сценария поиска организации дала довольно дерзкий ответ – что-то вроде «на карте поищи». И не стала ничего искать. Пользователь сначала удивился, а потом удивил и нас, похвалив поведение Алисы.

    Когда Алиса использует «нейросетевую болталку», в ней может проявиться миллион разных личностей, так как нейросеть вобрала в себя немного от автора каждой реплики из обучающей выборки. В зависимости от контекста Алиса может быть вежливой или грубой, жизнерадостной или депрессивной. Мы же хотим, чтобы персональный помощник представлял собой целостную личность со вполне определенным набором качеств. Здесь на помощь приходят наши редакторские тексты. Их особенность в том, что они изначально написаны от лица той личности, которую мы хотим воссоздать в Алисе. Получается, что можно продолжать обучать Алису на миллионах строк случайных текстов, но отвечать она будет с оглядкой на эталон поведения, заложенный в редакторских ответах. И это то, над чем мы уже работаем.

    Алиса стала первым известным нам голосовым помощником, который старается поддерживать общение не только с помощью редакторских ответов, но и используя обученную нейронную сеть. Конечно же, мы еще очень далеки от того, что изображают в современной фантастике. Алиса не всегда точно распознает суть реплики, что влияет на точность ответа. Поэтому работы у нас еще много.

    Мы планируем сделать Алису самым человекоподобным помощником в мире. Привить ей эмпатию и любознательность. Сделать её проактивной – научить ставить цели в диалоге, проявлять инициативу и вовлекать собеседника в разговор. Сейчас мы одновременно и в самом начале пути, и на переднем крае наук, изучающих эту область. Чтобы двигаться дальше, придется этот край подвинуть.

    • 10 октября 2017 года «Яндекс» официально своего голосового ассистента «Алиса».
    • В основе «Алисы» - нейронные сети, которые распознают речь, интерпретируют её , составляют ответы и синтезируют голос помощника. «Алиса» обучается на огромных массивах текстов, чтобы общаться с пользователем на свободные темы.
    • Есть и «редакторские» реплики, написанные командой для ответов на популярные вопросы.
    • Одна из главных сложностей в разработке такой системы: понять, что будет интересовать пользователей, и как они будут об этом спрашивать. Кто-то спрашивает у поисковика «где я», кто-то - «какая моя геолокация».
    • Основные отличия «Алисы» от конкурентов (к примеру, Siri) - интеграция с собственной поисковой системой компании и наличие нейронной сети, с помощью которой помощник самостоятельно генерирует новые реплики.

    Почему «Яндекс» взялся за разработку голосового ассистента

    К 2017 году своих голосовых помощников представили крупнейшие мировые ИТ-компании: на англоязычном рынке работает Siri от Apple, Assistant от Google, Alexa от Amazon, M от Facebook, Cortana от Microsoft. На азиатском - Duer от Baidu и Bixby от Samsung.

    За создание «Алисы» компания принялась в конце 2016 года. Сервис начали разрабатывать потому, что вся индустрия движется в этом направлении: пользователь хочет и готов решать свои задачи в форме диалога с виртуальным помощником, готовы к этому и алгоритмы, - и можно переходить от голосового ввода к осмысленному диалогу.

    Когда у пользователя появляется возможность задать вопрос голосом, он начинает говорить по-человечески. Вместо «Лада калина 2007 карданный вал дёшево купить» спрашивает: «Где мне купить карданный вал на "Ладу Калину" 2007 года»? Не выдумывает поисковый запрос, не формулирует его, как он привык это делать, а просто спрашивает.

    В этом направлении параллельно движутся и поисковые алгоритмы, и диалоговые интерфейсы. Но в голосовом помощнике есть привязка к контексту - то есть способность удерживать смысл реплик и понимать, связаны ли с ними последующие высказывания.

    Скажем, вы спросили «Алису»: «Какая завтра погода?» - она ответила вам: «+7 и ясно». Следующий вопрос может оказаться: «А на выходных?» Его легко понять человеку, но сложно машине - ведь в нём нет даже ключевого слова «погода». Диалоговый помощник умеет сопоставлять реплики и понимать, что вы всё ещё говорите о погоде.

    Илья Субботин

    Руководитель продукта «Алиса»

    По словам разработчиков, пользователи «Яндекса» уже умеют обращаться к сервисам компании голосом - команда «Слушай, Яндекс» работает и в «Поиске», и в «Навигаторе», и в других приложениях. Так что привыкать к новому интерфейсу им не придётся.

    Илья Субботин, руководитель продукта «Алиса»

    С пользовательской точки зрения, говорит команда проекта, с появлением «Алисы» меняется несколько вещей. Помимо диалогового интерфейса, помощник обрёл личность - «Алиса» проявляет эмоции, умеет шутить и «не терпит унизительного обращения в свой адрес». К ней теперь можно обращаться по имени: «Слушай, Алиса».

    С технологической - за работу помощника теперь отвечает многослойная нейросеть, которая учится на массивах текстов, понимает смысл запроса и самостоятельно синтезирует речь.

    Как работает «Алиса»

    «Алиса» встроена в поисковое приложение «Яндекса». Общаться с ассистентом можно как голосом, так и вводя запросы с клавиатуры. При возможности «Алиса» отвечает на заданный вопрос прямо в диалоговом интерфейсе, в других случаях - показывает поисковую выдачу по запросу или нужное приложение.

    Под капотом

    В основе «Алисы» - нейронные сети: они распознают речь, анализируют её, определяют тематику диалога, выделяют полезную для поиска информацию, синтезируют ответы помощника.

    Почти все вычисления, помимо голосовой активации (распознавания фразы «Слушай, Алиса»), проводятся в облаке. «Конечно, было бы интересно перенести часть вычислений на смартфон, чтобы "Алиса" иногда могла работать и без интернета, - говорит Илья Субботин. - Но вычислительная мощность смартфонов слишком низкая для таких задач».

    Технологии машинного обучения дошли до уровня, когда пользователь может просто говорить с приложением и видеть, что то его понимает, - а синтезированный голос приобретает звучание, близкое к естественному.

    Команда «Алисы»

    При этом мировое научное и технологическое сообщество находится лишь в начале пути - алгоритмы будут совершенствоваться и дальше. Распознавание речи, синтез, определение тематики беседы - всё это должно работать ещё лучше.

    Есть общие продуктовые метрики, по которым можно оценивать работу помощника, - удовлетворенность пользователя, частота использования приложения. Но есть и более сложные параметры, объясняет Субботин. Например, умение находиться в контексте беседы: помощник должен помнить, о чём его спросил пользователь, уметь верно интерпретировать дополнительные вопросы и давать релевантные ответы.

    «От релевантности одного конкретного диалога в будущем можно будет переходить к персонализации и мультизадачности: в идеале, когда я собираюсь на работу, я смогу спросить, что надеть, "Алиса" посмотрит погоду, маршрут до офиса, решит, на чем лучше доехать, и исходя из этого посоветует мне, что надеть».

    Как объективно оценивать способность системы вести диалог, пока не ясно. Длина диалога мало говорит о его содержательности: беседа может затянуться, если пользователю интересно обсудить что-то с ассистентом или если помощник долго не может решить его задачу. Но и короткий диалог не всегда говорит об успешном решении проблемы.

    Акцент на поиске

    Разработчики голосового помощника Siri от Apple намеренно наращивают количество диалоговых сценариев - чтобы не демонстрировать пользователю поисковую выдачу. Перед командой «Алисы» такой задачи не стоит, потому что «Алиса» - другой продукт.

    Apple поступает так не от богатства выбора. Просто это не поисковая компания. Мы абсолютно другие. Для нас поиск на первом месте - это лучший продукт, который у нас есть.

    Загадывать, как интегрированный с поиском помощник будет адаптирован для работы на других устройствах, пока рано, считает руководитель продукта «Алиса»: индустрия пока не выяснила, какие именно устройства окажутся востребованы у аудитории, а кроме того, такие устройства будут предполагать разные сценарии взаимодействия, под которые можно будет адаптировать систему.

    «У пользователя в любом случае есть задача, которую он хочет решить - взаимодействуя с голосовой колонкой или, допустим, системой управления автомобилем. В случае с колонкой упор будет сделан, вероятно, на музыке или новостях - и у нас есть музыкальный и новостной сервисы. В автомобиле водителя интересуют карты. Вряд ли он будет спрашивать у машины: "пластиковые окна купить дёшево"».

    Крупные технологические компании делают ставку на экосистем «умных» устройств - и это расширяет возможности взаимодействия с помощником. Если для ответа на вопрос устройству без экрана понадобится показать поисковую выдачу или открыть приложение, помощник сможет запустить нужный сервис на другом - например, на смартфоне.

    «Это лишь вопрос адаптации под устройство, - продолжает Субботин. Но, по-честному, мы пока ничего не знаем. Один из лидеров отрасли - Amazon, - до сих пор экспериментирует с форматами: у компании есть колонка Echo, мини-версия Echo Dot, варианты с камерой, с экраном».

    Личность

    Личность «Алисы», считают разработчики, - одно из её главных конкурентных преимуществ. Проекты, рассчитанные на англоязычную аудиторию, не пытаются создать сильную эмоциональную связь с пользователем, а наоборот, скорее от него отстраняются.

    Чтобы дать ассистенту личность, команде нужно было определиться с полом, возрастом, именем и чертами характера персонажа, описать поведение и составить реплики, которые помощник будет использовать для диалога с пользователем - «редакторские» ответы.

    Вместе с журналистом, писателем и бывшим руководителем группы маркетинга поиска «Яндекса» Владимиром Гуриевым разработчики описали характер персонажа и выбрали для него подходящие реплики.

    Всего команда описала около 320 сценариев, в которых помощник отвечает редакторскими репликами. Для каждого из таких сценариев заложено от двух до семи ответов, которые система выбирает случайным образом. «Этого достаточно, чтобы сформировать личность, но недостаточно, чтобы потрепаться обо всём на свете», - говорит Субботин.

    Разработчики решили, что ассистент будет молодой девушкой, которая всегда готова помочь владельцу смартфона, но при этом не допускает панибратского отношения. Она корректна и держит дистанцию, когда её пытаются оскорбить, но не высокомерна и не кичится своими знаниями.

    Помощник также должен быть ироничным и - это важно в контексте систем искусственного интеллекта - самоироничным. «Дело в том, что наш алгоритм речевого синтеза, - да и все алгоритмы конкурентов, - не очень-то хороши в эмоциях. "Алиса" немножечко над собой посмеивается, добавляя слова "шутка" или "сарказм", где это нужно. Потому что она знает про себя, что пока не может хорошо интонировать», - объясняют разработчики.

    Как выбирали имя

    Команда составила список имён, которые, как показалось сотрудникам, лучше всего подходили к выбранным чертам характера. К имени предъявлялись также технические требования: например, в нём не должно было быть буквы «р» - её не выговаривают маленькие дети.

    Кроме того, имя не должно было входить в другие слова или фразы. В качестве одного из вариантов разработчики рассматривали имя Майя - но оно могло спровоцировать ошибки распознавания на фразах вроде «Девятое мая». Важно было также, чтобы имя не входило в список наиболее популярных женских имён в России - чтобы сократить количество ложных активаций. Алиса в такой список не входит, но для тех пользователей, у кого в семье есть Алиса, останется возможность активировать помощника командой «Слушай, Яндекс».

    Определившись с вариантами, разработчики вместе с социологами и аналитиками «Яндекса» составили опрос для пользователей сервиса «Толока». В нём компания просила определить черты характера девушки по имени. «Пользователей нельзя спросить прямо, какое имя больше подходит ассистенту, и мы спросили хитро. Взяли нужные нам характеристики - и наоборот, совсем неподходящие, и стали спрашивать: если у девушки вот такое имя, то она скорее, например, добрая или агрессивная?».

    С большим отрывом, говорит Субботин, в опросе победило имя «Алиса». «И никто за время тестирования ни разу не сказал нам, что это плохое имя».

    Как «Алиса» обучалась во время тестирования

    Всего в тестировании ассистента приняло участие несколько десятков тысяч человек, а продлилось оно пять месяцев.

    Главное, что мы выяснили за это время, - что двигаемся в верную сторону. И что те вопросы, которые, как мы думали, должны волновать пользователей, действительно их интересуют.

    Перед запуском тестирования было важно определить наиболее вероятные сценарии взаимодействия: вопросы, которые пользователи будут задавать «Алисе», - а также понять, как именно они будут их задавать.

    «Мы понимали, что людей волнует, к примеру, погода. Отлично, чтобы рассказать о погоде, надо на что-то среагировать - на какие-то пользовательские фразы», - рассказывает Субботин. Определившись с темой, разработчики описали самые простые сценарии: например, когда пользователь просто спрашивает: «Какая сейчас погода?». Затем добавили более сложные варианты: прогноз погоды на конкретное число, на несколько дней, на несколько дней в следующем месяце.

    Ещё одна популярная тематика - определение местоположения. Изначально команда «Алисы» собрала несколько реплик, которыми пользователи могли бы активировать сценарий, но выяснилось, что зачастую люди задают вопросы совсем не так, как могли предположить разработчики. «Мы включили: "где я", "где я нахожусь", "какое моё местоположение", "какой у меня сейчас адрес". А пользователь спрашивает: "Подскажи, пожалуйста, где моя геолокация". Такое мы не могли предусмотреть».

    Разработчики отслеживают типы запросов пользователей и релевантность ответов помощника и добавляют в ассистента новые сценарии, которые не были заложены в него изначально.

    Команда также занимается разработкой специальной диалоговой модели - внутри компании её называют «болталкой», - которая в будущем может взять на себя всё общение с пользователем на отвлечённые темы и обучаться новым репликам самостоятельно.

    «Болталка» обучается на больших массивах текстов, в том числе диалогов. Порой, говорят создатели, они не могут предугадать ответы «Алисы» - настолько человечными они оказываются, - а иногда она может и нахамить собеседнику. Но разработчики отслеживают некорректные реплики и удаляют их из системы.



    © 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows