Нова технологічна платформа 20-х. Чому я не згоден із Цукербергом

Нещодавно прочитав статтю, де Марк Цукерберг давав прогнози про наступне десятиліття. Тема прогнозів мені дуже подобається, сам намагаюсь у цьому руслі думати. Так ось, у цій статті наведено його слова про те, що кожне десятиліття відбувається зміна технологічної платформи. У 90-х це був персональний комп'ютер, у нульові інтернет, а в 10-ті роки смартфон. На 20-ті роки він сподівається бачити у вигляді такої платформи віртуальну реальність. І ось із цим я якщо й можу погодитися, то лише частково. І ось чому…

Нова технологічна платформа 20-х. Чому я не згоден із Цукербергом

Людина в окулярах віртуальної реальності виглядає безглуздо. Користуватися ними можна лише вдома і лише у знайомій обстановці серед розуміючих людей. Тож суто віртуальна реальність це не наш вибір. Ось доповнена реальність – це вже цікавіше. Але про це згодом.

Все ж таки про ту технологічну платформу, яку бачу я в 20-х роках як базова. Вона стоятиме на 3 китах:

  • Голосове керування
  • Біометрична автентифікація
  • Розподілена мережа гаджетів

Ті голосові помічники, які зараз лізуть із усіх щілин, рано чи пізно призведуть до якісного стрибка у цій галузі. Мені здається, що ми прийдемо до якогось двигуна, який вміє працювати з голосовими повідомленнями та розширеннями для нього під кожну область. І так само як ми зараз пишемо ботів для Телеграм, писатимемо розширення для голосових помічників. І умовна Аліса не просто ставитиме будильник, але зможе зробити під диктовку замовлення фастфуду в додатку, який під таке рішення надає API.

Хоч би як проклинали голосові повідомлення, скоро вони будуть частиною нашого життя. І месенджери поступово мігрують до технологічного ланцюжка аудіо — текст — переклад — аудіо. Безперечно, можливість спілкування через текст залишиться, але не буде домінуючою. Зростає нове покоління, яке не любить набирати тексту, але любить спілкуватися. Тим не менш, формат повідомлень у месенджері зручніший ніж пряма телефонна розмова, оскільки дає можливість взяти паузу. До речі, на цій же хвилі тотально підвищиться «грамотність», тому що писати буде комп'ютер, а він помилок припускатиметься менше.

Але зараз робота із голосовими повідомленнями незручна. Як мінімум, потрібно витягувати смартфон, дивитися від когось повідомлення, натискати на кнопку для його прослуховування, записувати в мікрофон смартфона відповідь і відсилати співрозмовнику. Якщо голосовий помічник зачитуватиме таке повідомлення у навушник, буде зручніше. А зачитувати аудіо чи озвучувати текст — не так уже й важливо, все одно.

Але слухати це лише половина справи. Тут додаються ще деякі моменти. Наприклад, безпека. Якщо ми хочемо захищеності, доступ до листування потрібно давати тільки довіреному користувачеві. Ідентифікувати його допоможе біометрія. І найпростіше зробити ідентифікацію за голосом, коли ми відповідаємо на повідомлення, наприклад.

Друга сторона безпеки – це приватність. Якщо ми спілкуємося голосом, то оточуючі нас чують. А це не завжди зручно та прийнятно. І це проблема. До нейроінтерфейсів ми цього десятиліття не доростемо. Отже потрібно щось, що дозволить розрізняти шепіт, артикуляцію чи рух губ і основі цього формувати текстове чи звукове повідомлення. І такі нейромережі вже є.

Ще одна проблема - динаміки, мікрофон та/або камера. Витягувати смартфон для кожного голосового повідомлення, та й просто тягати його для цього в руці буде вже не так зручно. Тому камера, мікрофон і дисплей смартфона повинні переміститися в область розташування рота, вух та очей. Привіт, google glass.

Дозволю собі невеликий ліричний відступ. Пам'ятаєте наладонник Newton чи Tablet-PC? Дуже добротні, але випередили свого часу концепти планшетів. Планшет зростав до масовості лише з появою iPad. Про це зламано багато копій, не хочу заглиблюватись у дискусію, але обіпруся на цю аналогію. Мені здається, що час масових розумних окулярів ще не настав, але він уже поряд. Так як окуляри є, а масовості немає. Для себе я вивів такий критерій масовості: коли щось уже є у всього твого кола спілкування і, нарешті, це купують і твої батьки. Тоді це є масова технологія. У нинішніх окулярів забагато дитячих хвороб, які потрібно усунути. Без цього шлях ринку їм закритий.

Чи це будуть прозорі окуляри з проектором чи непрозорі окуляри з екранами — не так важливо. Просто непрозорі окуляри виглядають дикувато, про що я писав на початку, тому не думаю, що еволюція очок піде цим шляхом.

Ось доповнена реальність для таких окулярів – це просто пісня. Якщо алгоритми і обробка відео будуть такі швидкі і хороші, що проекція на видимий світ буде бездоганною, тоді й настане черга розумних окулярів. Якщо проекція буде не на екран окулярів, а на сітківку ока, то ще краще - додатки на кшталт «показувати всіх тіток голими» і «показати всі дані про людину» дадуть їм популярність. Чистої води кіберпанк, і він уже близько.

Очевидно, що в автомобілі водієві такі окуляри протипоказані — а раптом заглючать і перекриють огляд? (Так-так. Безпілотники ще не стануть домінуючою технологією у 20-ті роки, їм для розгону якраз і знадобиться це десятиліття.) Тому тут буде свій голосовий помічник та своя система проекції на лобове скло. Але в іншому все буде так само – можливість прослухати та надіслати повідомлення, керувати голосом тощо. Це передбачає єдиний профіль на всіх пристроях, до цього ми вже й так дійшли. Різниця буде лише в прозорій авторизації по обличчю, голосу чи сітківці ока.

Колонка з голосовим помічником, як елемент розумного будинку теж впишеться в цю екосистему, хоча і не набуде такої ж популярності як гаджети. Те саме буде зі спортивними трекерами та розумним годинником — вони займуть свою нішу і залишаться в ній. Власне, це вже сталося.

У принципі, зліт будь-якої IT-технології визначається тим, наскільки зручно з її допомогою заробляти гроші та дивитися порнуху. Ринок додатків для очок і голосових помічників це новий ринок, гроші на ньому з'являться, як тільки він стане досить великим. Ну а окуляри доповненої реальності просто створені для перегляду порно, тому мій прогноз, що технологія злетить і зададить тренд усьому десятиліттю. Так що зустрінемося через 10 років і підіб'ємо підсумки.

UPD. Я ще раз хочу зупинитися на вибраному моменті вище. Інтерфейси будуть насправді голосовими, але не гучними. Щоб віддати голосову команду, не потрібно буде вимовляти її голосно вголос або взагалі вимовляти. Так, зараз це звучить дивно, але ці технології лише на початку шляху.

Джерело: habr.com

Додати коментар або відгук