Хайп, SEO и пара метрик

в 7:01, , рубрики: Анализ и проектирование систем, веб-аналитика, Ланит, поисковая оптимизация

Иногда я читаю статьи на Хабре. Ключевое слово здесь - иногда. Не регулярно. Бывает, с очень большими перерывами. Когда есть подходящее настроение. Или наоборот нет никакого настроения. По крайней мере, это для меня более интересное и менее пугающее занятие, чем вечерний просмотр телевизора. Но последнее время я стал ловить себя на мысли, что инструменты Хабра, с помощью которых я пытаюсь составить свой список внеклассного полезного чтения, требуют небольшой, но важной доработки. Есть идея, как находить действительно интересные, но давно забытые статьи. Мне хотелось бы, чтобы у этих статей был шанс на вторую жизнь. После забвения.

По мотивам

Есть ли жизнь после смерти?

Вы спрашиваете как живет мой ёж?
Мой ёж живет плохо. Он умер.

Из детского письма редакторам раздела «Зеленый портфель» журнала «Юность»

По моим наблюдениям (и не только), перед тем как кануть в Лету, статья на Хабре «живет» дня три. После публикации, как правило, каждый последующий день статья набирает в два раза меньше просмотров, чем в предыдущий. В последующий месяц через неделю после публикации количество просмотров составляет от силы 10% от количества просмотров в первые три дня.

Если статье повезет, она понравится какому-нибудь поисковику и он разместит ее в первой десятке своего индекса по популярному запросу, то у статьи остаются шансы на прочтение спустя месяц после публикации. Но это сродни выигрышу в лотерею. При этом, совсем не обязательно, что контент, который понравился бездушному поисковику, так же понравится и живому человеку. Хотя иногда доступ к давно забытым материалам можно получить только благодаря тому, что на них обратил внимание какой-нибудь поисковик.

Бывает, что случайно нарвавшись на интересную статью, начинаешь перечитывать все статьи этого автора написанные давным-давно. А если автор уже не напишет новых статей? Если его статьи уже не попадут в рейтинг? Не так давно алгоритмы YouTube подсунули мне для просмотра кусочек квартирника Вени Д’ркина (Александра Литвинова) 1996 года. Ошалев от услышанного, я стал судорожно искать по Интернету все песни и сказки этого автора, которого, как оказалось, нет с нами уже четверть века. И мне не дает покоя вопрос, почему я узнал об этом явлении так поздно. Ведь даже ролик, который я случайно увидел, был опубликован более 10 лет назад.

Хабр не балует своих читателей разнообразными механизмами реанимации поиска статей, «мотивируя» посетителей на перелопачивание максимально большего количества материалов. С позиции SEO это, наверно, правильно. Чем больше страниц просмотрит посетитель, тем более интересен сайт с точки зрения ЯндексМетрики. А вот правильно ли это с точки зрения читателей?  

Источник

Выбор статей по количеству лайков в рамках выбранного хаба - фактически единственный способ, который  сегодня предлагает Хабр для поиска действительно интересной информации. Но насколько хорош такой способ? Лучшие статьи, по мнению Хабра, – это статьи с максимальным количеством лайков. С учетом того, что я могу выбрать только период от текущей даты, механизм поиска Хабра создает ситуацию, когда множество хороших статей с невысоким количеством лайков оказываются погребенными под толщей хайпа, который будет всегда измеряться только по отношению к сегодняшнему дню. Например, найти лучшую (даже по лайкам) статью за 2015 год в принципе невозможно.

По мотивам

Недавно введенный фильтр поиска статей по уровню сложности, меня, честно говоря, слегка раздражает, как бы намекая на мою умственную неполноценность. Кроме того, уровень сложности определяет сам автор статьи, исходя из собственных соображений, что в свою очередь не добавляет объективности такой оценке. Мне любопытно, какой бы уровень сложности выставил Элияху Голдрат для своего бизнес-романа «Цель»... Предполагаю, что уровень сложности сильно зависит не от автора, а от читателя. Кроме того есть подозрение, что если автор выставляет для своей статьи максимальный уровень сложности, он сам не совсем понимает то, что написал.

Наполеон говорил, что «Бог всегда на стороне больших батальонов».  Как показывает мой опыт,  количество просмотров благоволит оценке статьи на Хабре. По моим нехитрым наблюдениям, абсолютное количество лайков напрямую зависит от количества просмотров. Даже в случае ОЧЕНЬ успешных статей количество лайков, как правило, только в самых исключительных случаях превышает 1% (!) от количества просмотров в первый месяц после публикации (в период, когда можно оценивать статью).

В свою очередь, Фортуна, которая руководит просмотром статей, – это дама ветреная и непредсказуемая. По сведениям, полученным непосредственно от редакторов Хабра, количество просмотров статьи – это величина, которая зависит от множества факторов: от правильно выбранного названия, от времени публикации (времени года, времени суток и дня в рамках недели), от правильно подобранной картинки в анонсе, от популярности хабов, от количества статей той же темы (конкуренция за внимание читателей), от хайповости темы (например, статья про chatGPT сейчас и год назад - это две разные активности). Сюда же можно добавить множество других нюансов, технология описания которых сродни шаманству.

По мотивам

 Поэтому интересная статья запросто может не набрать достаточного количества лайков, чтобы обратить на себя внимание. Например, из-за того, что у нее оказалось недостаточно завлекающее название. А рекламная пустышка, «ненавязчиво» раскрученная в СМИ, будет оценена толпой как прорывное открытие.

Однако, изредка нарываясь на решения, которые были опубликованы на Хабре много лет назад и зачастую невысоко оценены читателями, я понимаю, какое ОГРОМНОЕ количество ЦЕННЫХ материалов находится в хранилище Хабра. Вопрос только в том, как сепарировать эти статьи от высокооцененного «шлака»?

Особенности переработки мусора

О если б вы знали, из какого сора
Растут стихи, не ведая стыда...

Анна Ахматова

У меня есть хобби. Кое-кто из моих знакомых это хобби называет «пунктиком». А некоторые - даже «диагнозом». Мое хобби заключается в том, что иногда я пишу статьи для себя Хабра.

Началось это летом 2019. На тот момент, моя проектная команда, уже два года применяла, как позже выяснилось, нетрадиционные, но достаточно эффективные, подходы к использованию JIRA. Однако поначалу, никто, кроме нашей проектной команды, в компании ЛАНИТ так не делал. При этом для анализа ситуации на проекте были применены самописные дашборды. Постепенно применяемыми инструментами начали интересоваться сотрудники других проектных групп.

И поэтому мне приходилось снова и снова рассказывать, как работает этот комбайн из традиционной JIRA и нетрадиционных дашбордов. Со временем это стало утомлять, несмотря на то, что я даже записал несколько видосов о принципах организации проектных работ с использованием этих инструментов. Однако кроме видео коллеги хотели иметь инструкции по применению этого подхода. Подбирать слова для сухого регламента мне было честно говоря в лом. Поэтому я решил написать статью об этом подходе на Хабр, не сильно ограничивая себя в выражениях. Формат статьи позволял не только рассказать то, что надо делать, но и давал возможность описать причины, которые привели к именно таким решениям. Видимо, тогда я и заразился хабратворчеством. Подозреваю, что без дофаминовой зависимости здесь не обошлось...

Внезапно я открыл для себя, что выгруженные на Хабр мысли значительно снижают  непродуктивные затраты мыслетоплива на бесконечные циклы самоанализа. Позднее узнал, что я не являюсь первооткрывателем этого метода, и у него даже есть собственное название - GTD. Как оказалось, на Хабр можно выгрузить не только описания решений задач, но и целую палитру трудно сдерживаемых эмоций, которые существенно влияют на эти решения.

Кроме этого, не секрет, что Хабр позволяет получить беспристрастную обратную связь от огромной аудитории экспертов, хейтеров и просто неравнодушных читателей, которым, однако, абсолютно безразличны все твои достижения, заслуги и регалии, полученные до публикации конкретной статьи...

Источник

Со временем выяснилось, чтобы физиотерапевтический эффект хабратворчества был полезен для здоровья, необходимо тщательно систематизировать и проработать все стороны проблемы, которая отражена в статье. А на это нужно время. Поэтому иногда от формирования первых строк до состояния, когда статью «пацанам было не стыдно показать», проходит, не поверите, несколько лет. Однако если статья хорошо «выдержана», к ней возвращаешься за помощью снова и снова при поиске решения сложных задач. А до того, статья «созревает» в облаке, постепенно обрастая все новыми нюансами, которые, с моей точки зрения, являются важными.

Я стал хорошо понимать Антона Павловича Чехова: он постоянно носил с собой блокнот, записывая мысли, которые могли прийти в голову, где угодно. Я подметил одну закономерность: наиболее интересные и вкусные  формулировки появляются в статье в период начинающийся за одну неделю перед и заканчивающийся через месяц-полтора после даты публикации.

То как оценят статью читатели имеет значение для автора. И не только как пища для удовлетворения тщеславия, но и как катализатор для качественного роста ценности опубликованных идей. 

По мотивам

И когда после публикации статьи суровая реальность начинает противоречить предварительной внутренней оценке своего опуса, при почти полном безразличии отсутствии комментариев читателей – это слегка напрягает. Поэтому в процессе накопления опыта по написанию своих статей, я нашел для себя два показателя, которые, на мой взгляд, более объективно отражают истинную ценность этих статей, чем просто количество просмотров или число лайков.

При поиске объективных метрик качества статьи я задался вопросом, а в каких случаях я лично голосую за статью, ставя лайк или помещая ее в свои закладки. И есть ли в этом разница?

Хайп, SEO и пара метрик - 7

По моему мнению, лайк (голос за статью, в терминологии Хабра) – это мое признание неоспоримой ценности статьи. При этом не всегда лайк совпадает с закладкой. Во-первых, хорошая статья может быть найдена после окончания срока голосования. Во-вторых, иногда я лайкаю статью, не отмечая ее в закладках, в том случае если статья принесла просто удовольствие от прочтения или подарила инсайт. Например, так было со статьей о разведении клубники.  И наоборот, в случае нахождения полезной справочной статьи я могу запросто положить ее в закладки, не поставив лайк.

После осмысления причин для положительной оценки статей мне стало гораздо проще жить уточнить показатели ценности публикуемого на Хабре материала.

Первый показатель – это среднее количество лайков на 1000 просмотров в первый месяц публикации статьи (фиксируется после первого месяца публикации).

Второй показатель – среднее количество закладок на 1000 просмотров за все время публикации статьи (меняется в зависимости от количества закладок и просмотров за весь период публикации статьи).

Как оказалось, эти метрики позволяют добиться справедливого умиротворения между безответной любовью к своим хабротворениям и кажущимся безразличием читателей к ним.

Источник

Вместе с тем, в какой-то момент я понял, что для нахождения интересных материалов на Хабре мне нужны инструменты поиска по тем же самым показателям.

Как я мерил ценность

Есть ложь, есть наглая ложь и есть статистика...

Марк Твен

За почти пять лет хабратворчества, как результат, у меня  появилось 12 детей статей. За это время я определился со своими основными предпочтениями – статьи посвящены одной из двух основных тем: или управлению программными проектами, или управлению образованием. Мне интересно, как можно повысить эффективность этих двух видов деятельности, и не только на основе применения компьютеров. Поэтому, как правило, эти статьи относятся к трем основным хабам Хабра:

С детства нас учат равняться на лучших. Поэтому сначала я решил посмотреть, а какие показатели имеют самые рейтинговые статьи в этих хабах. Лучших, по мнению Хабра. К сожалению, при их анализе я мог воспользоваться только общедоступной информацией. Тем не менее, это позволило оценить для каждой статьи количество закладок на 1000 просмотров.

По мотивам

В представленных ниже таблицах количество  закладок на 1000 просмотров округлено до целого в большую сторону. Значение этого показателя является нормированным, и по нему можно оперативно сравнить статьи с разным количеством просмотров и лайков.

Название статьи

Количество лайков

Количество закладок на 15.03.2024

Количество просмотров на 15.03.2024

Количество закладок на 1000 просмотров

Лучшее в хабе <Управление проектами>

[Пятничное] Теория Жоп

474

639

194000

4

Наша огромная гордость: мирные советские роботы-комбайны убрали первый урожай в южных регионах

444

203

78000

3

13 причин не быть управленцем

379

1160

461000

3

Производство в этот кризис: а знаете, всё оказалось лучше, чем в Венесуэле

360

104

87000

2

20 вещей, которые я должен был знать в 20 лет

346

3893

712000

6

Чешские программисты бесплатно написали сайт стоимостью 16 миллионов евро? Правда?

336

158

132000

2

Что случается с металлоломом и зачем там хардкорное ИТ

298

104

33000

4

Вы уволили самого талантливого сотрудника. Надеюсь, теперь вы довольны

290

389

168000

3

Повышаем сознательность граждан

280

402

90000

5

Ад своими руками

276

524

172000

4

Почему Мастерхост был обречен: взгляд изнутри

271

115

104000

2

Погромист. Мои самые эпичные провалы за всю карьеру

269

272

103000

3

Лучшее в хабе <Управление разработкой>

Чтобы пацанам было не стыдно показать

267

358

106000

4

Что делать, если в вашей команде появился «эффективный» менеджер?

242

339

184000

2

Собеседование в луже крови

239

200

143000

2

Надо помолчать

220

156

56000

3

Почему я ушёл из Google и начал работать на себя

216

361

142000

3

Гугл-программисты. Как идиот набрал на работу идиотов

208

241

172000

2

Что будет, если от разработчиков не отстать: умирающая команда

205

379

60000

7

«Сгоревшие» сотрудники: есть ли выход?

196

755

156000

5

Антисобеседования

191

395

141000

3

Эти токсичные, токсичные собеседования

189

338

104000

4

Как подсидеть тимлида

183

306

108000

3

Лучшее в хабе <Анализ и проектирование систем>

Ставим котю на ноги

349

124

75000

2

Как я чуть не стал миллионером, продавая воздух, или почему Россия – не Америка

275

389

113000

4

Приходите к нам на завод, у нас тяжело

268

266

137000

2

7 причин почему вам не стоит переходить на Mac, или как справиться с этой демонической машиной

259

244

204000

2

Вы — не Google

246

436

103000

5

Разработка ПО авионики

215

487

77000

7

Почему не плавится ковш и как мы учимся следить за жизнью футеровок

210

68

37000

2

Про одного парня

206

921

191000

5

Да, я пишу десктопные приложения под Windows

190

297

119000

3

Как оказалось, для этих статей количество закладок колеблется от 2 до 7 на 1000 просмотров, и это количество слабо взаимосвязано с рейтингом статьи по лайкам. Выяснилось, что одна из этих статей, набравшая максимальное количество закладок относительно просмотров, также является призером конкурса Технотекст. Это натолкнуло меня на мысль сравнить  нормированные показатели статей-победителей этого конкурса и статей-лидеров рейтинга по хабам Хабра.

На этот конкурс авторы Хабра в 2022 году представили  более пятисот статей. А на Технотекст-2023 уже больше тысячи. При этом каждый из конкурсантов может предоставить только одну статью, наилучшую с его точки зрения. Статьи представленные на конкурс, оценивает не ветреная Фортуна, а компетентная комиссия экспертов по каждому тематическому направлению.

Статьи-победители конкурса Технотекст-2023 в категории 🏆 Senior

Название статьи

Количество лайков

Количество закладок на 28.05.2024

Количество просмотров на 28.05.2024

Количество закладок на 1000 просмотров

Внутреннее представление и оптимизации строк в JavaScript-движке V8: «отмываем» строки, «обгоняем» C++

82

68

11000

7

Профилирование, ассемблер и все-все-все 

30

58

5000

12

Принципы непрерывного рефакторинга 

22

103

12000

9

О методах позиционного кодирования в Transformer

24

68

6700

11

Через реки, через лес прямо к PowerDNS

77

88

23000

4

Шесть причин, почему ваши A/B-тесты не работают 

56

115

32000

4

Как приручить автотестового монстра, или Dependency Injection в автотестах

14

48

6900

7

Как превратить DevOps-пайплайн в DevSecOps-пайплайн. Обзор концепции Shift Left 

19

68

9300

8

Медичи: семья, которая изобрела современные банки 

52

52

15000

4

Технологичные продукты, с которыми систематически обманывают производители

148

118

22000

6

Как прогнозировать время выполнения задач 

66

214

33000

7

Figma to Frontend: как мы автоматически синхронизируем дизайн и код 

41

96

22000

5

Георадар‑тюбинг — новый георадар скрытого пользования (GPR Izh‑Terra-1)

21

24

4900

5

Unity: 8 ошибок при использовании Async 

11

44

11000

4

Что бесит рекрутеров и соискателей на интервью. Собрала топ-5 триггеров

33

99

64000

2

Как мы научили ML-модель выбирать товары для акций в СберМаркете и увеличили ROI скидок в 8 раз

13

36

4300

9

Разработка цифровой аппаратуры нетрадиционным методом: Yosys, SpinalHDL, VexRiscv

58

93

8400

12

Как автоматизировать построение архитектурных схем в большой микросервисной системе

25

131

17000

8

Что бросилось в глаза в первую очередь, это то, что количество лайков, набранных статьями-призерами Технотекста-2023, разительно отличается от лидеров рейтинга Хабра. Подумать только, комиссия экспертов признала одной из лучших в году статью, которая набрала целых 11 лайков. Артхаус какой-то... В комиссию что-ли только неформалов берут? Или нет?

Во-вторых, сравнивая количество закладок на 1000 просмотров, можно увидеть, что у призеров Технотекста этот показатель заметно отличается в большую сторону, по отношению к статьям-лидерам рейтинга по лайкам.

Кроме того, проводя это исследование я выяснил, что выставив максимальный уровень сложности для своей статьи, вы фактически убиваете просмотры этой статьи. Посмотрите рейтинг статей за все время, выставив в поиске максимальный уровень сложности. На текущий момент, в хабе «Управление проектами», при таком раскладе статья имеющая 2 (два) лайка заняла 7-е место в рейтинге. В рейтинге из 8 статей. С другой стороны, можно немного продлить агонию  жизнь своей статьи, выставив максимальный уровень сложности через месяц после публикации, когда голосование за статью будет завершено. При этом, вы получаете большие шансы попасть в верхние строчки рейтинга лучших статей Хабра с максимальным уровнем сложности.

По мотивам

Конечно, для полноценной оценки валидности предложенных показателей надо провести множество измерений. С другой стороны, мне всегда импонировал пример Георга Менделя, который с помощью гороховой грядки в монастырском огороде ухитрился открыть основные законы генетики. Поэтому, прежде чем представлять эти метрики на суд читателей, я решил оценить, как эти показатели работают на моей «грядке». Для этого, по запросу редколлегии ЛАНИТ, редакция Хабра предоставила статистику о количестве просмотров моих статей в первые тридцать дней после публикации и по состоянию на 29.02.2024. Это дало возможность измерить не только количество закладок на 1000 просмотров, но и количество лайков на 1000 просмотров в первые 30 дней после публикации. Кроме того, получилось посчитать среднее значение просмотров статей в сутки, уже после ажиотажа первого месяца жизни статьи на Хабре.

Название статьи

Лайки

Закладки

Количество просмотров по состоянию на 29.02.2024

 

Количество на 1000 просмотров

на 30 день после публи-кации

всего

в сутки, позднее 30 дней после публи-кации

лай
ков

закладок

JIRA как средство от бессонницы и нервных срывов

67

324

19671

98178

49

4

4

JIRA: границы проекта

52

132

7438

20932

9

7

7

JIRA: управление требованиями

42

136

4839

27127

15

9

6

Моя прекрасная жаба

64

147

22429

27040

3

3

6

Проектные решения: игра по твоим правилам

35

100

3672

21620

14

10

5

ЕГЭ-1986: неудавшийся эксперимент

9

15

27142

28129

1

1

1

Матрица компетенций аналитика для самурая в запасе

57

208

10988

40952

32

6

6

JTBD: почему любимая работа вызывает отвращение?

73

108

19991

23848

5

4

5

Некомпетентные компетенции

168

245

45576

58425

22

4

5

Рабочее время: кошелек или жизнь?

108

162

13110

17395

10

9

10

Рафинад без сахара

35

47

2371

2767

1

15

17

Не все расписания занятий одинаково полезны

57

62

5363

5450

 

11

12

 

По мотивам

Тяжело быть объективным, когда дело касается себя любимого, однако попытаюсь. 

Значение средней частоты просмотра статей в сутки  через месяц после публикации показало, что не все статьи были забыты. Полагаю, благодаря поисковым системам, поскольку, по моим наблюдениям, эти статьи довольно долго находились в топах Yandex по достаточно частотным поисковым запросам (попробуйте догадаться сами, по каким именно). Однако, на мой авторский взгляд, этот показатель больше связан с соответствием поисковых запросов названию статей, чем с их истинной ценностью. 

Вместе с тем, по моему мнению, полученные значения нормированных показателей дают более адекватную оценку ценности моих статей. И более для меня ожидаемую. Очевидна высокая корреляция между нормированным количеством лайков и закладок. Вместе с тем, для отдельных статей эти значения существенно отличаются.

Кроме того, однажды сотрудник редколлегии ЛАНИТ заметил, что с набором опыта мои статьи стали более качественными. Это улучшение качества статей формально хорошо заметно по росту нормированных показателей с течением времени. Это косвенно подтверждает мой трехлетний опыт участия в конкурсе Технотекст  – два последних раза удалось как-то прокрасться в шорт-листы.

Источник

Однако дело не в признании моих статей. Вместо признания мне была бы гораздо более ценна их конструктивная критика.  Но я хотел бы читать интересные статьи других авторов. И при этом читать статьи, которые имеют высокие нормированные показатели, а не просто большое количество лайков.

Золотые рыбки

26 мая у Хабра был день рождения. 18 лет – совсем юный возраст. Однако, судя по ID в URL на Хабре на начало лета 2024 года собрано более 800 тыс. статей, охватывающих все сферы IT. Сложно даже представить, сколько идей и открытий спрятано в этом океане информации. Но чтобы эти идеи не оказались похороненными в архиве Хабра, для любознательного читателя нужна специальная удочка для ловли этих «золотых рыбок».

Источник

Когда-то давно поисковые системы оценивали ценность статей, исходя из соотношения количества совпадения слов в поисковых запросах и в самой статье. Создатели Google и Yandex реализовали другие алгоритмы создания поискового индекса, в основе которых лежал принцип построения индекса цитирования научных статей. Новые механизмы поиска изменили весь мир поисковых систем.

Хабр не входит в перечень  научных журналов, аккредитованных Высшей аттестационной комиссией РФ. И слава Богу. Установленные  правила к публикации научных статей зачастую прививают стойкое отвращение к их написанию. Хабр позволяет публиковать результаты научных исследований, почти не ограничивая автора в стиле и форме изложения. Что я собственно и делаю, публикуя результаты моих экспериментов исследований по управлению живыми людьми на программных проектах. Бывает, иногда, срабатывают старые рефлексы, и я пытаюсь выразить свои мысли, как того требовали правила публикации в научных изданиях. Однако комментарии недремлющих читателей Хабра быстро приводят в чувство реальности.

Хайп, SEO и пара метрик - 14

Несмотря на это, на мой взгляд, один из возможных путей совершенствования поисковых механизмов Хабра может быть основан на том же принципе цитирования научных статей. Как мне представляется, статья является более ценной, если на нее ссылаются другие статьи Хабра. При этом можно учитывать ценность отдельных ссылок с учетом кармы их авторов.

Мечта

Осознав возможность измерения ценности статей с помощью нормированных показателей, я хотел бы, чтобы поисковые механизмы Хабра позволяли мне искать статьи по этим метрикам за весь период существования этого уникального ресурса, а не только за последние неделю/месяц/год. При этом, так, чтобы начало и окончание интервала поиска я мог выбирать сам.  Предвкушаю, сколько интересного и полезного нового чтения может принести такой механизм. При этом, по моему мнению, в выигрыше будут не только дотошные читатели.

Предполагаю, что введение новых метрик оценки ценности статей Хабра приведет к росту количества заинтересованных читателей и существенно увеличит глубину просмотра и среднее время нахождения этих читателей на сайте, что в свою очередь положительно отразится на репутацию Хабра в рейтинге поисковых систем.

Поэтому я прошу всех, сумевших дочитать  эту статью,  высказать свое мнение о необходимости введения в поисковых механизмах Хабра новых метрик оценки ценности публикуемых материалов.


Автор: Александр Савин

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js