Недавно прочитал статью, в которой Марк Цукерберг давал прогнозы о следующем десятилетии. Тема прогнозов мне очень нравится, сам стараюсь в этом русле думать. Так вот, в этой статье приведены его слова о том, что каждое десятилетие происходит смена технологической платформы. В 90-е это был персональный компьютер, в нулевые интернет, а в 10-е годы смартфон. На 20-е годы он рассчитывает видеть в виде такой платформы виртуальную реальность. И вот с этим я если и могу согласиться, то лишь отчасти. И вот почему…
Человек в очках виртуальной реальности выглядит нелепо. Пользоваться ими можно только дома и только в знакомой обстановке в окружении понимающих людей. Так что чисто виртуальная реальность это не наш выбор. Вот дополненная реальность — это уже интереснее. Но об этом позже.
Все же о той технологической платформе, которую вижу я в 20-х годах в качестве базовой. Она будет стоять на 3 китах:
- Голосовое управление
- Биометрическая аутентификация
- Распределенная сеть гаджетов
Те голосовые помощники, которые сейчас лезут из всех щелей, рано или поздно приведут к качественному скачку в этой области. Мне кажется, что мы придем к некоему движку, который умеет работать с голосовыми сообщениями и расширениями для него под каждую область. И точно так же как мы сейчас пишем ботов для Телеграм, будем писать расширения для голосовых помощников. И условная Алиса будет не просто ставить будильник, но сможет сделать под диктовку заказ фастфуда в приложении, которое под такое решение предоставляет API.
Как бы ни проклинали голосовые сообщения, скоро они будут частью нашей жизни. И мессенджеры постепенно мигрируют в технологическую цепочку аудио — текст — перевод — аудио. Безусловно, возможность общения через текст останется, но не будет доминирующей. Растет новое поколение, которое не любит набирать текст, но любит общаться. Тем не менее, формат сообщений в мессенджере более удобен чем прямой телефонный разговор, так как дает возможность взять паузу. Кстати, на этой же волне тотально повысится «грамотность», так как писать будет компьютер, а он ошибок допускать будет меньше.
Но сейчас работа с голосовыми сообщениями неудобна. Как минимум, нужно вытаскивать смартфон, смотреть от кого сообщение, нажимать на кнопку для его прослушивания, записывать в микрофон смартфона ответ и отсылать собеседнику. Если голосовой помощник будет зачитывать такое сообщение в наушник, будет удобнее. А зачитывать аудио или озвучивать текст — не так уже и важно, все едино.
Но слушать это только половина дела. Тут добавляются еще некоторые моменты. Например, безопасность. Если мы хотим защищенности, то доступ к переписке нужно давать только доверенному пользователю. А идентифицировать его поможет биометрия. И проще всего сделать идентификацию по голосу, когда мы отвечаем на сообщение, например.
Вторая сторона безопасности это приватность. Если мы общаемся голосом, то окружающие нас слышат. А это не всегда удобно и приемлемо. И это проблема. До нейроинтерфейсов мы в этом десятилетии не дорастем. Значит нужно что-то, что позволит различать шепот, артикуляцию или движение губ и на основе этого формировать текстовое или звуковое сообщение. И такие нейросети уже есть.
Еще одна проблема — динамики, микрофон и/или камера. Вытаскивать смартфон для каждого голосового сообщения, да и просто таскать его для этого в руке, будет уже не так удобно. Поэтому, камера, микрофон и дисплей смартфона должны переместится в область расположения рта, ушей и глаз. Здравствуй, google glass.
Позволю себе небольшое лирическое отступление. Помните наладонник Newton или Tablet-PC? Очень добротные, но опередившие свое время концепты планшетов. Планшет дорос до массовости только с появлением iPad. Об это сломано много копий, не хочу углубляться в дискуссию, но обопрусь на эту аналогию. Мне кажется, что время массовых умных очков еще не пришло, но оно уже рядом. Так как очки есть, а массовости нет. Для себя, я вывел такой критерий массовости: когда что-то уже есть у всего твоего круга общения и, наконец, это покупают и твои родители. Тогда это массовая технология. У нынешних очков слишком много детских болезней, которые нужно устранить. Без этого путь на рынок им закрыт.
Будут ли это прозрачные очки с проектором или непрозрачные очки с экранами — не так важно. Просто непрозрачные очки выглядят диковато, о чем я писал в начале, поэтому не думаю, что эволюция очков пойдет по этому пути.
Вот дополненная реальность для таких очков это просто песня. Коль скоро алгоритмы и обработка видео будут так быстры и хороши, что проекция на видимый мир будет безупречной, тогда и придет черед умных очков. Если проекция будет не на экран очков, а на сетчатку глаза, то еще лучше — приложения типа «показывать всех теток голыми» и «показать все данные о человеке» дадут им популярность. Чистой воды киберпанк, и он уже близко.
Очевидно, что в автомобиле, водителю такие очки противопоказаны — а вдруг заглючат и перекроют обзор? (Да-да. Беспилотники еще не станут доминирующей технологией в 20-е годы, им для разгона как раз и понадобится это десятилетие.) Поэтому тут будет свой голосовой помощник и своя система проекции на лобовое стекло. Но в остальном все будет так же — возможность прослушать и отправить сообщения, управлять голосом и т.п. Это предполагает единый профиль на всех устройствах, к этому мы уже и так пришли. Разница будет только в прозрачной авторизации по лицу, голосу или сетчатке глаза.
Колонка с голосовым помощником, как элемент умного дома тоже впишется в эту экосистему, хотя и не приобретет такой же популярности как носимые гаджеты. То же самое будет со спортивными трекерами и умными часами — они займут свою нишу и останутся в ней. Собственно, это уже и случилось.
В принципе, взлет любой IT-технологии определяется тем, насколько удобно с ее помощью зарабатывать деньги и смотреть порнуху. Рынок приложений для очков и голосовых ассистентов это новый рынок, деньги на нем появятся, как только он станет достаточно большим. Ну а очки дополненной реальности просто созданы для просмотра порно, так что мой прогноз, что технология взлетит и задаст тренд всему десятилетию. Так что встретимся через 10 лет и подобьем итоги.
UPD. Я еще раз хочу остановиться на выделенном моменте выше. Интерфейсы будут по сути голосовыми, но не громкими. Чтобы отдать голосовую команду, не нужно будет произносить ее громко вслух или вообще произносить. Да, сейчас это звучит странно, но эти технологии только в начале пути.
Источник: habr.com