Структурирование данных: что делать с интернетом?

в 11:41, , рубрики: gtd, данные, ИИ, интернет, метки: , ,

Все чаще появляются топики, которые посвящены проблемам хранения, поиска и структурирования данных. И источники самих топиков растут из за неприятного факта, что порой тебе нет возможности что-то найти, пусть даже самое простое. И в итоге поисков люди находят развлекательные порталы и вещи, на которых и оседают. Например, последний топик Идеальный персональный менеджер информации — какой он?, в нем автор упоминает ситуацию про поиск какой-то определенной формулы. И что каким-то странным образом поиск формулы превращается в просмотр роликов.

Ситуация реальная. Ты чего-то ищешь, а далее твой глаз цепляется за что-то постороннее и привлекательное. А далее…

И каждый раз предлагается унифицировать и стандартизировать способ хранения данных.


В каждой компании, тем или иным способом «знания» структурируются. И сложно сказать, что способы структурирования у двух разных компании совпадут. Кто-то использует «деревья», кто-то «графы», кто-то «сетевые представления». В каждом представлении есть свои особенности разбиения данных. И когда внедряются такие системы, то всегда возникают недочеты, которые закрываются «костылями». Ничего страшного в этом нет, так как полностью универсального инструмента не существует, но реально существуют инструменты, которые помогают в разы облегчить этот процесс, пусть и со своими ограничениями. Именно поэтому существует огромное количество (и оно становится больше) различных инструментов для упрощения работы с тем или иным процессом. Это и общение (сколько Вы знаете мессенджеров и сервисов по общению?). Это работа с финансами (как для людей, так и для компаний). Это обработка данных (фото-, видео- и т.д.). Это…

Сервисов становится все больше, больше и больше. И ничего странного в этом нет. Сколько людей, столько и мнений по представлению того, как должен работать тот или иной сервис.

Когда речь идет о компаниях, то реальные решения есть, со своими особенностями, но есть. И так или иначе задачи структурирования данных решаются. И все счастливы и довольны.

Но, все камни преткновения находятся на моменте, когда те или иные решения начинают примеряться на сеть интернета. И есть замечательные проекты, такие как википедия, различные поисковики. Без них сейчас сложно представить поиск информации, и хоть какая-либо работа с интернетом, вне сайтов, которые Вы знаете. И скорее всего лет через 20 эти способы будут совершенно другими.

Но, даже нынешние проекты, по хранению и представлению данных, не всегда справляются с объемами информации. И если Вы читаете какие-нибудь развлекательные сайты (например, баш), то видите, что люди обращают внимание на то, к каким причудливым образам приводят некоторые попытки поиска информации.

Темпы роста информации становятся все больше, больше и больше. Придумывают стандарты, чтобы хоть как-то направить вектор информации. Но, тут же «сбоку» придумывают другие стандарты. Развиваются возможности. Теперь представить себя в интернете — вообще не проблема. При этом чем дальше, тем меньше нужно знать о каких-либо технических моментах. Сеть развивается, становится более мощной и разнообразной. Да, есть и куча хлама, но она есть во всем. Вы же тоже каждый день выкидываете мусор.

Из-за различного представления того, как необходимо структурировать информацию, возникают недопонимания.

Мы привыкли работать по схеме «Раздел 1» -> «Подраздел 1.2» -> «Нужная информация». Сейчас привыкаем работать по схеме графа, когда существуют перекрестные ссылки и взаимосвязи. Но, тем не менее, этого все равно не хватает.

Поэтому, так или иначе, все уже давно движутся в сторону искусственного интеллекта. Возьмем, например, нейронную сеть. Она хранит в себе информацию далеко не тривиальными способами. Но, когда нам надо, то мы всегда можем получить от нее ответ. Такой способ представления и работы явно будет приоритетнее. Когда весь поиск и анализ существующей информации перейдет на плечи компьютера или сети. Ведь как мы действуем, когда что-то ищем. Открываем поисковик. Затем переходим по ссылкам. Из тех сайтов, которые мы видим, мы пытаемся вычленить необходимую нам информацию. Далее могут возникнуть дополнительные вопросы. И мы снова открываем поисковик. Затем…

Т.е. кроме фильтров, которые представляет нам поисковик, мы сами осуществляем фильтрацию и реструктуризацию данных. А чем мы это делаем. Собственной головой. А это и есть нейронная сеть.

Поэтому мне кажется, что не стоит обвинять сеть в ее порочности и бессвязности. Стоит думать над тем, как можно сеть научить думать. И выдавать именно то, что нам надо.

Хотел поделиться мыслями. И узнать Ваше мнение по этому поводу.

Автор: FBT

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js