Время от времени я встречаю на страницах Хабра мысль, что современные браузеры не соответствуют современным требованиям, стали слишком сложными, делают всё не так и не туда, и вообще - ниша “забронзовела”, поделилась между игроками (Blink, WebKit, Gecko) и новичкам с новыми движками в неё стало невозможно попасть в принципе. В своей прошлой статье я коснулся основ работы с телеграм-ботами и в какой-то момент мне показалось, что я увидел прообраз “браузера будущего” - приложения, через которое люди будут подключаться к Сети совсем скоро (а некоторые подключаются уже сейчас).
Под катом я попытался формализовать словами свои субъективные ощущения (КДПВ не моя, это всё DALL-E).
Что такое Web 3.0?
Я придерживаюсь точки зрения, что Сеть будет развиваться в сторону Web 3.0, а концепция Web3 (“всё через блокчейн”) является лишь частным случаем с ограниченным ареалом применимости.
Так вот, в основе Web 3.0, на мой взгляд, лежит преобладание взаимодействия компьютерных систем друг с другом над взаимодействием людей друг с другом или компьютеров и людей. То есть, если раньше люди писали друг другу тексты “на заборе” (статические сайты), потом начали обмениваться друг с другом сообщениями (чатики), то сейчас, с развитием ИИ, в “чатиках”, в основном, будут сидеть и общаться друг с другом "ботики". Люди же будут общаться с ботами на начальном (дать задание) и конечном (получить результат) этапах.
С точки зрения отдельного человека, как “центра всего”, Web 3.0 также включает в себя децентрализацию и частные данные. Но есть у меня ощущение, что в Web 3.0 взаимодействие человеков друг с другом и ботами - это всего лишь надводная часть айсберга (~10%). Основная же часть взаимодействий в Сети (~90%) - это взаимодействие сервисов друг с другом (ботов).
Основной формат данных в Web 3.0
Если большую часть взаимодействий составляют взаимодействия сервисов (ботов), то понятно, что из “большой тройки” HTML/CSS/JS вторые два там вообще не нужны, а HTML превращается в XML (JSON/YAML/…). То есть для 90% случаев взаимодействий, по сети Web 3.0 бегают структурированные данные, и лишь для 10% случаев взаимодействий нужно будет их представление для человеков.
Лично у меня основным каналом получения информации является текст и схемы, но в моём окружении есть значимое количество людей, предпочитающих для получения информации использовать видео- и аудио-источники (YouTube и подкасты).
Оконечное устройство для человеков
Уже сейчас бОльшая часть людей подключается в сеть через свои смартфоны. Эти устройства совсем не соответствуют тем условиям под которые проектировались классические браузеры (большой дисплей, клавиатура и мышь). Появление в смартфонах (и не только в смарфонах) персональных голосовых ассистентов (Сири, Алекса, Джемини, Кортана, Алиса) выводит взаимодействие человека и Сети на уровень, далёкий от текста и картинок (и очень далёкий от клавиатуры и мыши). Смартфоны без таких сервисов, как STT и TTS, можно уже приравнять к кнопочным телефонам.
В случае внедрения в человеков чипов, я полагаю, взаимодействие человека с Сетью всё равно будет происходить через некое подобие смартфона. Примерно по такому же принципу сейчас к смартфону подключается периферия в виде смарт-часов или фитнес-браслетов и уже через смартфон периферия способна взаимодействовать с Сетью. Голосовое управление при этом получит приоритет среди других способов коммуникации.
Ограничения современного браузера
Нынешние браузеры специально ограничены в своих возможностях. Часть этих ограничений обусловлена безопасностью, часть - слишком разнородной средой функционирования (смартфоны, планшеты, ноутбуки, десктопы). По сравнению с барузерами нативные приложения лучше могут использовать аппаратные возможности смартфонов (основное оконечное устройство для человеков).
Мне представляется, что в браузере будущего специализированность заменит универсальность. Фокус с текста и картинок сместится на аудио-, видео-информацию и тактильное взаимодействие. А важную роль станет играть возможность “браузера” взаимодействовать с аппаратной “начинкой” смартфона и его периферией. Здесь уже не так важно будет, как “движок” рендерит входящий код (все эти сложности с соответствием стандартам W3C), а важнее будет, как и какими ресурсами смартфона сервисы смогут пользоваться через этот “браузер”.
Мессенджеры и боты
Такие мессенджеры, как Telegram, Discord, Slack, WeChat, Viber, … являются нативными приложениями (имеют максимальный уровень доступа к аппаратным ресурсам смартфона) и в то же самое время имеют свой собственный API для “программирования” взаимодействий с пользователем внутри чатов через внешние сервисы (боты). Другими словами, каждый из этих мессенджеров является прообразом “браузера будущего”, который может обмениваться с ботами Сети структурированной информацией и представлять её человеку (или получать её от человека) через голосовой интерфейс или визуализировано. При этом внутри себя мессенджеры не связаны требованиями W3C - каждый из них сам себе режиссёр и сам устанавливает правила взаимодействия со своими ботами.
ЯП
Боты вне мессенджеров могут быть написаны на любом языке программирования. Внутри мессенджера может быть любой ЯП на выбор авторов. Но скорее всего это будет либо что-то на базе основного языка веб-программирования (JS), либо что-то на базе основного языка ОС смартфона (Java/Swift). Хотя и варианты Python, Dart и т.п. тоже не исключены. При этом не обязательно воспроизводить всю функциональность базового ЯП, достаточно выбрать лишь часть (по аналогии с RISC-архитектурой процессоров).
Мощностей смартфонов хватает, чтобы можно было “боты вне мессенджера” запускать непосредственно на смартфоне, а не в Сети. В таком случае можно “тяжёлые” вычисления производить максимально эффективно с учётом имеющегося железа, а обмен информацией “локального бота” с самим мессенджером может не сильно отличаться от обмена с “сетевым ботом” (зато появляется возможность работы офлайн).
Заключение
В будущем, на мой взгляд, триада HTML/CSS/JS значительно утратит свою актуальность. Основное взаимодействие в Сети (90%) будет происходить в текстовом формате между сервисами. Взаимодействие с данными для людей и от людей преимущественно будет осуществляться через смартфоны (или их подобия). Значимость текстового контента заметно снизится, в то время как роль аудио- и видео-коммуникаций значительно возрастет. Ключевым инструментом взаимодействия человека с Сетью станет нативное приложения (а-ля мессенджер), поддерживающий расширение функционала как за счёт сетевых, так и локальных сервисов-ботов. Внутри такого приложения возможности программирования пользовательского взаимодействия будут стандартизированы и упрощены, с возможным появлением сокращённых версий языков программирования общего назначения. При этом улучшится интеграция с аппаратными ресурсами смартфонов и периферийными устройствами.
Вот это и будет браузер для Web 3.0.
Автор: flancer