- Обзор Amazon Echo
- Содержание
- Плюсы:
- Минусы:
- Что такое Amazon Echo
- Дизайн
- Включение и настройка
- Функционал
- Использование в России
- Качество звука и распознавание речи
- Умный дом
- Стоит ли покупать Amazon Echo?
- Другие умные колонки на Amazon
- Что мы знаем об Amazon Alexa? Или первые впечатления от Amazon Echo Dot
- Интересные ресурсы и ссылки:
Обзор Amazon Echo
Подробный обзор умной колонки от компании Amazon с голосовым ассистентом Alexa.
Активируемая голосом умная колонка Amazon Echo с ассистентом Alexa это не только футуристичный девайс, но также практичный и доступный. Стремительно растущий список функций, интеграций и сценариев использования впечатляет, трудно представить весь потенциал устройств Echo.
Содержание
Плюсы:
- “Всегда слушает” — просто скажите “Alexa” в комнате с устройством и отдавайте команды, никаких кнопок
- Превосходное распознавание речи
- Голосовое управление умным домом
- Хороший дизайн
Минусы:
- Не поддерживается русский язык, Alexa работает только на английском, немецком и японском.
- Нет аккумулятора, работает только от розетки
- Встроенный звук хуже по сравнению с другими динамиками данной ценовой категории
Что такое Amazon Echo
Представьте Bluetooth- или Wi-Fi колонку с голосовым помощником внутри, таким как Siri или Google Assistant. Это и есть Amazon Echo с голосовым ассистентом Alexa – первый искусственный интеллект, получивший собственное отдельное устройство. Она будет постоянно ожидать ваши команды (“всегда слушает”), отвечать на вопросы, включать музыку и управлять устройствами умный дом. Alexa способна взаимодействовать со сторонними приложениями и даже делать покупки.
Amazon Echo был выпущен в 2015, за прошедшие два года продано более 11 миллионов устройств. Amazon выпускает обновления для Эхо каждую неделю, растет количество Skills – сторонних приложений-навыков. Сейчас Alexa выглядит очень неплохо в сравнении с Siri и ассистентом Google, а отдельное устройство с 7 микрофонами дает ей такое качество распознавания речи, которому Apple и Google пока могут только завидовать.
Дизайн
Устройство может показаться внушительным, когда вы его вытаскиваете из коробки, но в помещении Echo выглядит довольно неприметно. Черный или белый цилиндр органично впишется в любой интерьер.
Как многие другие Bluetooth-колонки, Echo обладает звучанием на 360 градусов. Решетка динамиков в нижней половине устройства выполнена в лаконичном и аккуратном дизайне.
На верхней поверхности устройства расположена едва заметная окружность вырезов для 7-ми разно-направленных микрофонов, которые позволяют принимать команды от пользователя, находящегося в любой части комнаты. Также сверху расположен светящийся ободок, который сигнализирует приятным голубым светом, когда вы обращаетесь к Echo. Это вызывает странные теплые ощущения, видеть, что Alexa внимательно ожидает вашего запроса. Светящийся ободок также просигнализирует, когда запрос принят и ведется его обработка.
Практически всегда вы будете использовать голосовые команды, но есть ручная регулировка громкости (вращением верхней части цилиндра) и кнопка отключения микрофона.
Вряд ли вы будете переносить Echo с места на место, так как, в отличии от большинства bluetooth-динамиков, у устройства нет аккумулятора и оно всегда должно быть подключено к розетке. Также нет AUX-выхода (который присутствует на Echo Dot), поэтому внешнюю аудиосистему можно подключить только посредством Bluetooth.
Включение и настройка
Подключить Echo не составит труда даже для тех, кто только начинает пользоваться умными устройствами. Включите устройство в розетку, выберите на компьютере в списке Wi-Fi-подключений появившуюся сеть с названием в формате AMAZON-XXX, подключитесь к ней и введите в личном кабинете Alexa логин и пароль от своей домашней сети Wi-Fi. Соединение с интернет Echo держит очень стабильно, без нареканий. Если возникнут сложности, можете воспользоваться подробной инструкцией по подключению на нашем сайте.
Подключить через блютус телефон или планшет тоже очень просто. Просто скажите “Alexa, pair”, найдите Echo в списке bluetooth-устройств на телефоне и нажмите “соединиться”.
Функционал
Сложно вкратце описать все возможности Amazon Echo. Вы можете включить музыку через подписку Amazon Prime Music (не работает в России), или Spotify (нужна подписка Spotify Premium), который вы можете сделать основным источником музыки для Echo. Во время воспроизведения музыки вы можете попросить Alexa пропустить трек, увеличить или уменьшить громкость. Используя интеграцию с сервисом TuneIn вы можете слушать любую радиостанцию или подкаст из этого сервиса. Там присутствуют многие российские станции. В качестве персонализированного радио доступен сервис Pandora.
На устройство можно переложить многие повседневные задачи. Установить и выключить будильник, таймер во время приготовление ужина, узнать курс валют, значение незнакомого слова, запросить сводку статьи из википедии. Alexa можно подключить к вашему Google-календарю и управлять своим расписанием.
Если вы скажете “Alexa, What’s in the news?” начнется воспроизведение Flash Briefing – персонализированной сводки новостей из выбранных вами источников. Помимо BBC, CNN и Guardian можно установить и новости на русском языке.
Вы сможете контролировать голосом большое количество устройств для умного дома. Например, включить освещение на кухне “Turn on the lights in the kitchen”. Всё это работает превосходно. Со всеми стандартными командами Alexa можно ознакомиться в отдельной статье.
Также существуют приложения-навыки Alexa Skills от сторонних разработчиков. Большинство из них скучные вроде интересных фактов или цитат известных людей. Но есть и очень полезные, такие как Fitbit, навык-переводчик или тренировка памяти.
Использование в России
Как мы писали выше, на данный момент умные колонки от амазон не поддерживают русский язык, и когда добавят русский неизвестно. Мы используем Эхо на английском языке – можно выбрать американский или британский диалект, а также немецкий или японский язык.
В России Echo работает хорошо, со стороны Amazon доступны практически все функции, за исключением покупок голосом на амазоне по понятным причинам и музыкального стримингового сервиса Amazon Music (который работает только в 28 западных странах, но есть отличная альтернатива – Spotify, да и Pandora работает прекрасно). Остальные возможности работают отлично: вы сможете установить российский адрес, узнавать прогноз погоды, получать ответы от Алексы на справочные вопросы, устанавливать приложения и управлять устройствами для умного дома.
Качество звука и распознавание речи
Каждый из 7-ми микрофонов Echo предоставляет распознавание речи на большом расстоянии. Amazon может похвастаться тем, что их устройство услышит вас даже когда из динамиков будет играть достаточно громкая музыка.
Распознавание речи постоянно улучшается с момента выпуска Echo. Сейчас оно работает просто невероятно, Alexa поймет вас, даже если вы немного странно сформулируйте фразу или невнятно произнесёте пару слов в запросе. Даже сильный русский акцент устройство понимает отлично. В основном вам не нужно будет помнить и использовать специальные команды, вы просто делаете запрос в обычной форме, в которой обращались бы к человеку, в большинстве случаев Alexa поймет вас.
Заметим, что Echo отправляет все ваши запросы на сервера Amazon для распознавания и анализа. Чтобы повысить качество распознавания именно вашего голоса в вашем помещении, в настройках можно запустить короткий режим тренировки для Alexa.
Умный дом
Амазон Эхо уже совместим с большинством популярных производителей устройств для умного дома, например Philips Hue, WeMo, TP-Link. Если же у вас уже есть система умного дома с хабом, то скорее всего Echo тоже поддерживает ваш Hub. Общее правило: ищите на коробках гаджетов надпись «Works with Alexa». В целом, по отношению к производителям устройств у Amazon более открытый и дружественный подход, в отличии от, например, Apple с их стандартом HomeKit и умной колонкой HomePod.
Есть специальная версия колонки Эхо для владельцев большого количества гаджетов для умного дома – Amazon Echo Plus, которая вышла в конце 2017 года. У Эхо Плюс помимо Wi-Fi имеется ещё и Zigbee чип, который превращает колонку в полноценный контроллер для умного дома: вы можете подключать лампочки, выключатели, розетки, датчики движения и другие «мелкие» устройства умного дома, работающие на zigbee частоте, без стороннего хаба – напрямую к колонке.
Стоит ли покупать Amazon Echo?
После года использования мы можем сказать вам, что если вы владеете английским языком даже на начальном уровне, то Эхо – это не бесполезная игрушка, а очень практичное домашнее устройство. Amazon Echo станет частью вашего дома, вы будете голосом управлять освещением, телевизором и другими умными девайсами. Устройство полностью заменит радио на кухне и станет отличным помощником в готовке благодаря возможности легко устанавливать таймеры.
iPhone полностью изменил то, как мы взаимодействуем с приложениями и технологиями, позволив нам делать это касаясь экрана. А сейчас Alexa совершает такую же революцию, но на этот раз с помощью голосового управления. Узнать, где купить Amazon Echo можно на этой странице. Если же вы ищите умную колонку на русском языке, то пока единственный вариант – это Яндекс Станция с помощником Алиса.
Другие умные колонки на Amazon
Ознакомиться со списком команд для умных колонок Amazon Echo можно в отдельной статье или в нашем справочном приложении со списком команд (обновляется регулярно):
Источник
Что мы знаем об Amazon Alexa? Или первые впечатления от Amazon Echo Dot
Давно прошло время «войны браузеров», однако, ее результаты отчетливо видны и сегодня. Сейчас у пользователя есть выбор среди различных надежных, удобных и фактически однотипных программных решений, подкрепленных стандартами HTML5, CSS3 и, конечно, стремительно развивающимися реализациями JavaScript. Но все началось с того момента, когда компании-разработчики с чего-то решили, что «победитель», доминирующий на рынке браузеров, будет и «управлять» Интернетом. И, как говорят философы, история повторилась. Похоже, теперь речь идет о голосовом интерфейсе и, соответственно, конкуренции голосовых ассистентов.
Image: How to Mount your Amazon Echo Dot on the Wall, Ceiling, or Under the Counter – Android Central
Исторически голосовой набор номера был реализован еще в первых кнопочных сотовых телефонах, впрочем, как и Bluetooth Hands-Free. Затем появились голосовые технологии Apple Siri, Google Now и Microsoft Cortana, а только вслед за ними мир увидел Amazon Alexa. В отличие от предыдущих решений сервис Alexa был привязан не к определенному гаджету или операционной системе, компьютеру и т.д., а сопровождался голосовым ассистентом, как устройством и при этом, технически стал доступен на любом устройстве.
Что мы видим сейчас: выход на рынок Google Home, Apple HomePod и Microsoft Cortana, в составе беспроводной акустики Harman Kardon Invoke. Чем не «война» голосовых ассистентов. А если вспомнить недавний анонс о том, что Amazon купила стартап Ring, занимающегося решениями в области безопасности умного дома и, совсем свежее заявление, о прекращении продаж термостатов Nest компании Google на площадке Amazon, то становится очевидным, что уже начинается «бой» не просто за Интернет, как площадку для рекламы, а за лидерство в сфере Интернета вещей (Internet of things, IoT) и, в частности, умного дома (Smart Home).
Image: Echo Dot (2nd Generation) – Amazon
Рассмотрим более подробно инфраструктуру вокруг Alexa и, в частности, устройство Amazon Echo Dot. Интерес к решению Amazon Alexa вполне понятен, т.к. предлагаемый сервис, гаджеты и облако AWS тесно связаны между собой и создают для пользователя и разработчиков единое информационное пространство, в котором на первое место выходит голосовое управление. Не удивительно, что экосистема Amazon сейчас выходит на новый уровень интерактивности с клиентом, как магазина, так и всей облачной платформы AWS.
Не случайно, в завершении 2017 года, умная колонка Echo Dot стала лидером продаж на площадке Amazon. При официальной цене $49.99 и, например, небольшого ожидания очередной акции от Amazon, можно получить цену за девайс в размере $29.99. А, как показал опыт проекта Raspberry Pi, как раз цена порядка 35-ти долларов вполне оправдана для «разжигания» интереса у гиков. Хотя устройство не поддерживает русский язык, это не повод для того, чтобы не интересоваться новым. Вспомним, как когда-то не было русскоязычного интерфейса в популярных операционных системах и т.п.
Сегодня покупка на площадке Amazon, даже, если мы физически не находимся в США, не составит большого труда. Самое простое – это прибегнуть к услуге почтового форвардинга. Еще есть ограничение в том, что за пределами США поддерживаются не все сервисы, с которыми может взаимодействовать Alexa. Но вряд ли такие региональные привязки сильно повлияют на интерес к новому, тем более, проигрывание платных каналов – не основное преимущество для голосовых ассистентов. Правда, сразу стоит признать, что доступность коммерческих медийных сервисов значительно расширяется, а голосовое управление добавляет к ним очень удобный функционал. Так же сервис Alexa доступен и на других устройствах, например, смарт камере Echo Look, приставке Fire TV Stick с дистанционным управлением Alexa Voice Remote и многих других. Кстати, узнать возможности Amazon Alexa можно всего лишь установив соответствующее приложение на смартфон или планшет (в линейке Fire Tablet with Alexa сервис уже предустановлен), но полностью сервис доступен при использовании специализированного голосового ассистента.
Устройства Echo ($99.99) и Echo Plus ($149.99) оснащены хорошей акустикой, а дополнительно Echo Plus включает в себя еще и встроенный Smart Home Hub. Устройства Echo Spot ($129.99) и Echo Show ($229.99) содержат встроенные дисплеи. На фоне этих устройств колонка Echo Dot занимает начальные позиции, но, например, всегда к ней можно подключить проводную акустику или использовать для этого Bluetooth, а в качестве экрана выступит планшет или смартфон. Поставка Echo Dot также минималистична, как и само устройство: мягкая картонная коробка с колонкой, блок питания 9 Вт, кабель Micro-USB и небольшая брошюрка «Quick Start Guide». Для подключения колонки следует установить приложение из Amazon Appstore, Google Play или Apple App Store. Затем, поскольку устройство сразу после покупки, скорее всего, будет привязано к учетной записи Amazon, в мобильном приложении останется ввести параметры подключения к Wi-Fi. В это время устройство сначала откроет доступ к себе, став точкой доступа Wi-Fi, а затем, после выбора требуемой точки доступа, переключится на нужную сеть. Однако, если Echo Dot конфигурируется из приложения Android, то в настоящее время не удастся ввести параметры SSID для скрытой сети. Правда, с Fire Tablet таких проблем не будет, т.к. в приложение для своих планшетов Amazon включила пункт ручного добавления точки доступа Wi-Fi. Если устройство еще не привязано к аккаунту, то можно выполнить инициализацию нового устройства через меню приложения «Set up a new device».
Что же, после нехитрой настройки сразу можно поинтересоваться: «Alexa, what can you do?», «Alexa, what time is it?», «Alexa, what’s in the news?», Alexa, stop.», «Alexa, how’s the weather?», «Alexa, Wikipedia: Artificial intelligence.» И так далее, например, можно сделать голосовой звонок на мобильный (только для локации США, Канада, Мексика) или на устройство с Alexa, а также послать SMS и многое другое. Для добавления новых навыков голосовому ассистенту нужно всего лишь зайти на сайт Alexa Skills или просто спросить, например, «Alexa, what are your top skills?» и затем выбрать нужные.
Популярность Amazon Alexa вполне можно объяснить амбициями всемирного интернет-магазина и, одновременно, облачной платформы AWS, но все же на первом плане стоят удобство речевого управления и доступность огромного числа готовых «навыков» (Skills) платформы, которые постоянно пополняются благодаря открытому API. Также в пользу Alexa можно добавить то, что везде, где установлено приложение, будь то смартфон или планшет и т.п., у пользователя всегда находится под рукой актуализированная база подключенных устройств, входящих в локальную инфраструктуру. Это достигается очень просто, благодаря единой учетной записи в сервисе Amazon.
Сейчас существует множество устройств и сервисов, которые поддерживают Alexa, начиная от умных лампочек, дверных замков и всяческих розеток до систем уровня хаба умного дома, облачного сервиса и т.п. Если бы не конкуренты, то можно было бы сказать, что Alexa стает стандартом де-факто для умного дома. Кстати, фактически так оно и есть, учитывая распространенность решений для Alexa на рынке США, ведь вряд ли современным высокотехнологичным производителям и многочисленным стартапам составляет большую сложность добавление требуемого функционала или свих «Skills» для платформы голосового интерфейса, предлагаемой Amazon.
Что можно сказать, немного наговорившись с Alexa по средствам Echo Dot? Пожалуй, это удобно и, несомненно, очень интересно «поиграться» с самой технологией. Встроенные микрофоны, как показалось, воспринимают ключевую фразу немного на повышенных тонах и с интонацией вопроса, т.е. благодаря этому практически нет ложных срабатываний. Возможно, нужно достаточно хорошее произношение английского языка для реакции на ключевое слово и, конечно, правильного последующего распознавания фразы. Также лучше подключить внешнюю акустику. Ко всему этому хочется расширения мультиязычной поддержки сервисом, ведь сейчас Alexa поддерживает только: English (US, UK, Canada, India, Australia), German, Japanese, French (будет скоро добавлен). Но не смотря на все недостатки, нельзя не признать уникальность сервиса и всей инфраструктуры Amazon.
Alexa позиционируется не только, как пользовательское устройство для умного дома, но и собирается завоевать корпоративную нишу, уже в качестве управляемого сервиса для бизнеса. Например, с голосовым ассистентом, вполне, можно реализовать сценарии из повседневной офисной жизни: “Alexa, call Jeff.”, “Alexa, ask Teem to find an open conference room.”, “Alexa start the meeting.”, “Alexa, order more paper for the copier.”, “Alexa, turn on the lights.”, “Alexa, ask Splunk, ‘how many Amazon EC2 instances are running in South America’.”, “Alexa, when is my next meeting?” и т.п. Проведение конференций, работа с расписанием, календарем, заказ бумаги для офисного принтера/копира, а также голосовые запросы статистических данных, например, по компании, предоставляемым сервисам, продуктам и т.д., все это и многое другое несомненно должно привлечь внимание корпоративного пользователя для организации совместной работы в офисе или компании в целом.
Image: Alexa for Business – Amazon Web Services
Принципиально Alexa for Business отличается от обычного потребительского сервиса, наличием привязки устройств не к персональному аккаунту пользователя, а корпоративной учетной записи, что дает возможность централизованно управлять устройствами, группировать их и добавлять необходимые навыки для Alexa. При этом в корпоративной учетной записи могут быть зарегистрированы и пользователи, и их персональные устройства, что может расширить функционал навыков голосового ассистента для конкретного пользователя. По замыслу разработчиков, Alexa должна помочь эффективно организовать рабочее место и пространство для совместной работы. Фактически, по достаточно произвольной голосовой команде можно получить адекватную ответную реакцию необходимых систем или узнать нужные сведения.
Picture: Alexa for Business – Amazon Web Services
Конечно, если говорить о безопасности, то не стоит «учить» Alexa раскрывать сразу всем конфиденциальные данные компании. В этом плане, следует отметить, что для сервиса Alexa for Business предусмотрен дополнительный набор API, в котором предусматривается возможность получения информации о местоположении устройства. Таким образом, голосовой запрос выполняется в контексте устройства и его привязки к расположению в офисе. Понятно, речь идет не об GPS-координатах, а о фактической группировке устройств, которое задается в панели управления сервисом. Так же, отметим, что вряд ли стоит пытаться автоматизировать максимум сценариев для голосового ассистента, получив тем самым: автоматизацию ради ее же самой. К тому же, не стоит ждать, что голосовые запросы пользователей повысят продуктивность работы, например, в Open Space офисах, хотя, и тут можно придумать ряд интересных сценариев.
Screenshot: Announcing Alexa for Business: Using Amazon Alexa’s Voice Enabled Devices for Workplaces – AWS News Blog
Можно рассмотреть еще различные варианты использования Alexa в инфраструктуре офиса, например, в конференц-зале достигается положительный эффект от голосового ассистента при проведении презентации и настройке оборудования. Для упрощения рутинной работы в переговорной комнате, вполне уместно попросить Alexa озвучить перечень предлагаемых продуктов и услуг, детализировать определенные характеристики и т.д. Получаем, что сервис голосового ассистента достаточно хорош не только для умного дома, но и весьма неплох на рабочем месте. Главное соблюдать баланс и не навязывать такой сервис только ради того, чтобы угодить новому тренду. Но уже сейчас видно, что у Alexa есть все перспективы, чтобы гармонично дополнить любое офисное пространство.
Но, как говорится, из офиса возвращаемся домой, затем, снова – в офис, конечно, на своем автомобиле и тут Alexa тоже стремится занять свое «почетное» место. Сейчас ведущие автопроизводители (BMW/Mini, Ford, SEAT, Skoda, Toyota/Lexus, Volkswagen и др.) и компании, разрабатывающие автоэлектронику, заявили о ближайшей поддержке Alexa и включении голосового ассистента в состав своих транспортных средств. Таким образом, сервис Alexa стает доступным повсеместно. Но, конечно, интересно и то, как будут разворачиваться события, например, относительно других производителей голосовых сервисов и ассистентов. А также, например, в контексте недавней оригинальной разработки Mercedes-Benz User Experience (MBUX), дебютировавшей в серии A-Class моделей 2018 года.
Image: Toyota is adding Amazon’s Alexa to cars. We’ve been using Alexa in a car for 6 months and it’s the best infotainment system we’ve ever used — Business Insider
Итак, поскольку Alexa наращивает темпы проникновения на рынок, а также соответствующий сервис явно заслуживает внимание разработчиков, то сразу встает вопрос о том, как создать свой оригинальный навык (Skill)? Кстати, сделать это можно совсем элементарно, если воспользоваться мобильным приложением и продумать свой диалог с системой.
Screenshot: Приложение Alexa на телефоне с Android (рисунок подготовлен с использованием сервиса MockUPhone)
Более интересно поуправлять «живыми» устройствами, например, умного дома, прибегнув к помощи голосового ассистента. Для этого можно воспользоваться подходом, основанном на эмуляции устройства Belkin WeMo, что достаточно часто описывается в Интернет-публикациях энтузиастов, разрабатывающих системы умного дома и стремящихся применить голосовой интерфейс в своей инфраструктуре.
Конечно, если только прозвучало упоминание «умный дом», то фактически сразу стоит упомянуть о соответствующем стандарте де-факто для реализации конечных устройств – микросхеме ESP8266 или подобных бюджетных решениях. За эталонное устройство так или иначе придется взять устройства WeMo, т.к. Amazon Echo умеет с ними работать напрямую и протокол обмена данными достаточно «изучен» энтузиастами. Сразу хочется отметить, что поскольку этот подход основан на реверс-инжиниринге протоколов коммерческих устройств, то к нему следует относиться, хотя, как наиболее простому решению для «умного дома», но понимать, что для задач потребительского уровня, скорее всего, потребуется лицензирование протоколов или сертификация своих устройств. Во всяком случае потребуется «договориться» с Amazon о поддержке решений. Но пока интересно рассмотреть только саму концепцию взаимодействия с голосовым ассистентом на уровне прототипа.
Picture: Amazon Echo and Home Automation – Maker Musings
Итак, в качестве примера можно взять реализацию протокола взаимодействия на Python или, еще проще, использовать технологии проекта Arduino IDE для устройств ESP8266. Один из приглянувшихся проектов – «Arduino Esp8266 Alexa Multiple Belkin wemo switch emulator», позволяет, фактически в очень сжатые сроки разработать свое смарт-устройство с голосовым интерфейсом. Для разрабатываемого устройства следует немного адаптировать код прошивки. Потребуется лишь ввести параметры подключения к Wi-Fi точке доступа и модифицировать код функций обратного вызова, которые будут выполняться в зависимости от логики работы устройства. Например, объявление вызова переключателя света в комнате: «room = new Switch(«apartment lights», 80, roomLightsOn, roomLightsOff);». Соответственно, функции «roomLightsOn», «roomLightsOff» должны задавать логику работы цифровых портов платы. Все просто, впрочем, как для любого проекта в стиле Arduino.
Photo: Разработка на базе Esp8266 и взаимодействие с устройством через голосовой интерфейс Alexa
После прошивки платы на основе ESP8266 остается только дать команду: «Alexa, Discover Devices». Затем в мобильном приложении появятся обнаруженные устройства в настройках «Smart Home» и далее можно будет уже создавать свои навыки для Alexa и соответствующих устройств. Пожалуй, такой путь создания Alexa Skill самый простой для пользователя. Следует добавить, что поиск смарт-устройств можно выполнить и в мобильном приложении без включенной Alexa, но тогда для разрабатываемых устройств должен присутствовать заранее предопределенный навык и т.п. Пожалуй, с точки зрения разработки это более правильное решение, т.к. будет использован официальный API Alexa. Здесь одним из самых простых решений может стать использование известного сервиса IFTTT. Кстати, для отладки навыков может быть интересен сервис Alexa Skill Testing Tool.
Если говорить о разработке для IoT и умного дома, то скорее всего «умный» концентратор (Hub) для такого решения уже будет содержать поддержку технологий Amazon Alexa, например, openHAB Cloud service, ioBroker и другие или функционал голосового ассистента можно будет обеспечить на уровне ранее упомянутого сервиса IFTTT. Также этот сервис вполне интегрируется со средой Node-RED.
Picture: Functional Architecture – openHAB Cloud
Для тех, кто совсем не хочет разбираться с документацией Alexa SDK и программированием, вполне подойдут интерактивные сервисы для «обучения навыкам» голосового ассистента. Это сервисы Backendess и Storyline. И в первом, и во втором для создания навыков используется графический интерфейс на базе «Drag and Drop» и заранее предопределенных блоков.
Screenshot: Storyline lets you build and publish Alexa skills without coding – TechCrunch
Интерфейс сервиса Storyline аскетичен и прост, а Backendess подойдет тем, кто любит создание логики в стиле Google Blockly.
Screenshot: Developing Alexa skill without writing any code – Part1 (Codeless in Backendless mBaaS) – Backend as a Service Platform
Очевидно, что самый правильный путь, впрочем, как и бесплатный, для разработки своих навыков Alexa – это использование оригинального Alexa Skills Kit от Amazon. Этот путь рассмотрим немного дальше в этой публикации. А сейчас, пожалуй, отвлечемся от программных решений и рассмотрим аппаратную платформу Amazon Echo Dot.
Текущая, вторая, версия Echo Dot состоит из двух плат. Одна – с одним микрофоном по центру и шестью по периметру, плюс светодиодная подсветка. Вторая – фактически ядро системы на базе 64-битного 4-х ядерного ARM процессора от Mediatek.
Интересно то, что Amazon приветствует разработку устройств на базе технологии Alexa и предлагает AVS Device SDK для построения таких систем. Кроме того, на сайте разработчиков Amazon Alexa в разделе Alexa Voice Service представлены готовые наборы для прототипирования устройств Development Kits for AVS. Из таких наборов для прототипирования, в основном на базе различных цифровых сигнальных процессоров DSP, можно выбрать подходящий пример для своего устройства или, наоборот, использовать только часть системы, предназначенной для оцифровки звука. Ценовой диапазон наборов для прототипирования достаточно широк, начиная от $1,250.00 за завершенную систему Qualcomm Smart Audio 6-Mic Development Kit for Amazon AVS или всего $129.00 за Allwinner SoC-Only 3-Mic Far-Field Development Kit for Amazon AVS. Для систем реализующих только оцифровку звука, цены в диапазоне от $499.00, например, за Intel Speech Enabling Developer Kit for Amazon AVS или $299.00 за Microsemi AcuEdge Development Kit for Amazon AVS и т.п.
Алгоритм работы и структура AVS Device SDK достаточно понятна. Устройство пользователя должно распознать ключевую фразу «Alexa» (используется Audio Input Processor и Wake Word Detection (KWD) – библиотека распознавания ключевой фразы, фактически реализуемая аппаратной системой на чипе или DSP), затем следует оцифровать и передать остальную часть голосового запроса для обработки в облако Amazon и последующего выполнения предписаний (используются библиотеки: Alexa Communications Library (ACL) для передачи данных в формате JSON по протоколу HTTP/2, Alexa Directive Sequencer Library (ADSL) для обеспечения жизненного цикла директив, Capability Agents для обеспечения интерфейса событий и т.п.).
Picture: Alexa Voice Service SDK Architecture – GitHub
Таким путем Amazon активно стимулирует стремительное развитие инфраструктуры голосового ассистента. И рынок быстро реагирует на ситуацию вокруг голосового интерфейса Alexa,. Например, появляются интересные устройства, например, как зарядка Roav VIVA по цене со скидкой на Amazon порядка $39.99, которая добавляет навыки Alexa в любой автомобиль с использованием устройства, стандартно подключаемого через прикуриватель.
Нельзя не отметить, что AVS Device SDK можно установить на различных платформах: Ubuntu Linux, Raspberry Pi (Raspbian Stretch), macOS, Windows 64-bit, Generic Linux. Конечно, отдельно следует выделить возможность установки на Raspberry Pi 2 или 3. Получается, что можно превратить Raspberry Pi в некое подобие Echo Dot. Но сразу хочется оговориться, дело в том, что AVS Device SDK создан для прототипирования устройств и «игра будет стоит свеч», если цель – создание устройства. Для простого ознакомления вполне достаточно установить мобильное приложение.
Чтобы увидеть в действии AVS Device SDK и разобраться с составляющими платформы рассмотрим установку на Raspberry Pi 3 под управлением Raspbian Stretch with Desktop. Сначала стоит установить на Raspberry Pi операционную систему и сделать минимальные настройки, например, настроить локаль клавиатуры, подключиться к Wi-Fi. Кстати, бытует мнение, что для Raspberry Pi сложно настроить подключение к скрытой точке доступа. На самом деле, требуется только подредактировать файл настроек: «$ sudo nano /etc/wpa_supplicant/wpa_supplicant.conf». В конец этого файла следует добавить строчки с именем скрытой точки доступа и соответствующим паролем:
Затем, стоит побеспокоится о микрофоне. Если вывод звука Raspberry Pi 3 может обеспечивать в цифровом виде по HDMI или на обычном аналоговом выходе, то для микрофона целесообразно приобрести за $2 – $3 плату звуковой карты с USB-интерфейсом. И далее, следует настроить подсистему ALSA на работу с картой. AVS Device SDK использует настройки звуковой подсистемы заданные по умолчанию. Для большинства дешевых аудио-карт с USB скорее всего не потребуется установка драйверов. Система определится как USB PnP Sound Device и чипом C-Media. Например, можно узнать командой: «$ dmesg | grep C-Media» или «$ lsmod | grep snd_usb_audio». Для вывода всех устройств воспроизведения и записи можно использовать команды: «$ aplay -l» и «$ arecord -l», а управлять уровнями громкости из консоли с помощью: «$ alsamixer».
Photo: Развертывание AVS Device SDK на платформе Raspberry Pi 3
Пожалуй, самое простое решение для настройки по умолчанию звука на базе Raspberry Pi 3 – это вывод по HDMI-каналу и запись микрофона c USB-звуковой карты. Следующий этап – это разворачивание AVS Device SDK, но перед этим стоит зарегистрироваться на портале Amazon developer и в разделе Alexa Voice Service зарегистрировать свой продукт, пусть даже это будет локальный тестовый образец. Дело в том, что после загрузки всех составляющих AVS Device SDK: «$ wget raw.githubusercontent.com/alexa/avs-device-sdk/master/tools/Install/setup.sh && wget raw.githubusercontent.com/alexa/avs-device-sdk/master/tools/Install/config.txt && wget raw.githubusercontent.com/alexa/avs-device-sdk/master/tools/Install/pi.sh» нам потребуется заполнить конфигурационный файл config.txt, где следует указать токен доступа и идентификаторы клиента и устройства, которые задаются или генерируются на этапе регистрации голосового устройства:
После выполненных действий остается лишь запустить установочный скрипт и принять решение о соглашении с лицензией от Amazon и сторонних разработчиков: «$ sudo bash setup.sh config.txt». Все, теперь только нужно авторизовать в облаке новое устройство по протоколу OAuth, запустив скрипт: «$ sudo bash startauth.sh» и перейти на локальный сервер: localhost:3000. Теперь запускаем тестовое приложение и общаемся с Alexa: «$ sudo bash startsample.sh». Особенно хочется отметить, что если взглянуть в настройки мобильного приложения Alexa, то там автоматически появится наше новое устройство. Это еще один маленький штришок в пользу целостности инфраструктуры голосового ассистента от Amazon.
Вся последовательность действий развёртывания AVS Device SDK на базе Raspberry Pi хорошо описана в документах: «Raspberry Pi Quick Start Guide with Script» и «Create Security Profile». От себя хочется добавить, что большую проблему составляет настройка аудио-интерфейса. Следует отметить, что модуль распознавания стартового слова так и не начал работать, но фразы команд и вопросов прекрасно записываются и обрабатываются облаком. Немного создается впечатление прерывания ответных реакций системы, похоже, это вызвано приоритетом вывода диагностических сообщений. Стоит еще раз подчеркнуть, что AVS Device SDK стоит воспринимать не сколько заменой Echo Dot, а средствами разработки, хотя, как сказать, ведь все зависит от энтузиазма и вдохновения.
Еще нельзя не упомянуть о том, что в нашем случае, для платы Raspberry Pi 3 не успели приехать из Китая радиаторы, поэтому во время компиляции плата была близка к перегреву и все-таки один раз зависла. Перезапуск установки все решил, впрочем, как и понижения внешней температуры в помещении, хорошо, что коммунальные службы удачно подгадали и отключили отопление.
Итак, хотя публикация и стала достаточно большой, но все-таки поставленная цель близка – фактически мы приближаемся к полному описанию инфраструктуры голосового ассистента Amazon Alexa и, в частности, устройства Echo Dot. Если разбить этот обзор на части, то просто потеряется целостность «всей картины». Для завершения описания инфраструктуры проекта Alexa, просто необходимо хоть и вскользь упомянуть о правильном пути «right way», или официальном, разработки своих навыков для голосового ассистента от Amazon. Конечно, такая разработка начинается с портала разработчиков и Developer Console.
Screenshot: New Alexa Skills Kit Developer Console (Beta) Streamlines Development Process – Alexa Blogs
Фактически разработка проходит через фазы: build, test, launch, measure. Сначала в интерактивном режиме описывается проект и создается основа проекта, затем в консоли разработки можно протестировать навыки и запустить проект, сделав его публичным или частным, а также разработчикам предоставляется статистика по использованию их навыков. Документация по созданию навыков на основе Alexa Skills Kit позволяет быстро начать и выполнить свой проект, а сам Skills Kit предоставляет множество готовых примеров, которые можно взять за образец для разработки. Также Alexa Skills Kit включает множество подготовленных API-интерфейсов, которые можно использовать совместно со своими навыками.
Функционально разрабатываемые навыки делятся на четыре вида: Custom skill (custom interaction model), Smart Home Skill API (pre-built model), Video Skill API (pre-built model) и Flash Briefing Skill API (pre-built model). Пользовательские навыки (Custom skill) – это традиционный диалог между устройством с навыками Alexa и пользователя. Если для реализации навыка потребуется логика ветвления или работа с базой данных, то для реализации программной части Amazon предлагает связать разработку навыка и возможности облака AWS при помощи сервиса AWS Lambda.
Фактически разработка сводится к описанию взаимодействия с Alexa в формате файлов JSON и программирования сервиса AWS Lambda, с размещением (хостингом) в этом же сервисе реализации своего навыка. Alexa будет посылать запросы на сервис Lambda, где программный код на Node.js, Java, Python илиr C# будет выполнять логику запроса. Как альтернатива – это размещение реализации своего навыка на своем же веб-сервисе и хостингом на любой альтернативной площадке, например, другого облачного хостинг-провайдера. В случае самостоятельного хостинга программный язык реализации не играет роли, главное, чтобы веб-решение поддерживало стандартный протокол HTTPS для работы с API Alexa.
Следующий тип навыков – это Smart Home Skill API, как несложно догадаться, предназначенный для решений, связанных с аппаратными решениями и оборудованием умного дома. Здесь сервис AWS Lambda может стать своеобразным «мостом» между работой голосового ассистента и серверами, выполняющими обработку и управление «электронной начинкой» умного дома, впрочем, как и другими смарт-устройствами, например, промышленного применения, для сферы бизнеса и т.п.
Picture: How the Smart Home Skill API Works – Alexa Skills Kit
Оставшиеся направления реализаций навыков для Alexa – это разработка навыков по управлению и работе с видео-контентом (Video Skill API) и работы с новостным контентом (Flash Briefing Skill API), например, работа с запросами HTTPS, лентами новостей в формате RSS или контентом структурированном в формате JSON и т.п. Но тут стоит признать, что лучше «один раз попробовать» и создать свой навык для Alexa, чем «смотреть» и заниматься теорией. Хотя, это уже непременно будет материалом для наших следующих публикаций.
В завершении хочется отметить, что у Amazon есть еще множество интересных решений, связанных с искусственным интеллектом и аудио интерфейсом в контексте облака AWS. Например, если не требуется управлять устройствами, а только озвучить некоторые фразы, то в облаке Amazon существует сервис Polly, который преобразует текст в естественную речь и сохраняет результат в файле MP3.
Picture: Amazon Polly – Amazon Web Services
В случае, если требуется создать чат-бота, который понимал бы естественный язык, можно использовать Amazon Lex. Этот сервис, на основе технологий глубокого обучения, которые, кстати, использует и Alexa, позволяет выполнить автоматическое распознавание речи, получив на выходе текст.
Picture: С помощью Amazon Lex можно создавать сверх интерактивные диалоговые пользовательские решения для подключенных устройств – Amazon Web Services
Но, безусловно, с Alexa значительно веселее и, пожалуй, проще решать задачи на новом уровне построения аудио интерфейсов для взаимодействия с устройствами IoT, при том, что цена на колонку Echo Dot стала вполне доступной. Впрочем, у каждого гика найдется под рукой подходящая плата Raspberry Pi, на которую элементарно устанавливается Alexa Voice Service. Фактически голосовой ассистент Echo Dot на основе сервиса Alexa расширяет рамки устоявшихся подходов для решения повседневных задач. Конечно, есть ограничение на локализацию, на количество предоставляемых услуг вне США и т.п. Но всегда интересно взглянуть в будущее и поэкспериментировать с этим в настоящем.
Пусть Alexa сейчас ошибается и, например, может случайно напугать своим смехом, или среагировать на «голосовую атаку» спровоцированную рекламным сообщением в телевизоре, но искусственный интеллект от Amazon непрерывно совершенствуется, переводя на новый уровень существующие компьютерные системы. К слову сказать, проблема со смехом решена замены фразы «Alexa, laugh» на «Alexa, can you laugh», а реакция на массовые голосовые запросы просто отсекается искусственным интеллектом облака. Правда, что будет, если запрос не массовый, а именно направлен на компрометацию определенного устройства, атаку на конкретного пользователя и т.д.? Пожалуй, это уже новый повод рассмотреть подходы к обеспечению кибербезопасности, в целом, и защиту устройств с голосовым интерфейсом, в частности. И, конечно, немного «космического» юмора с Alexa.
Далее, пожалуй, следует рассмотреть альтернативные решения, например, от компании Google, сравнить сервисы и т.д., но, как говорится, это уже тема для следующей публикации. И всегда интересны комментарии наших читателей об опыте работы с Alexa или идеями о роли и месте речевых интерфейсов в нашей повседневной жизни. Ведь, с одной стороны, такие решения пока больше направлены на получение некоего «вау-эффекта» от демонстрации технологии, но с другой стороны – нельзя не признать потенциальное удобство и пользу от рассмотренных нами технологий и решений.
Интересные ресурсы и ссылки:
Теория, сравнения и описание инфраструктуры:
Источник