Уже более десяти лет я регулярно читаю Хабр, однако, как и многие другие пользователи, обычно концентрируюсь на статьях из своей ленты новостей. Это практично, но существует вероятность упустить интересные публикации, которые остаются вне моего внимания. Чтобы разобраться в актуальных тенденциях, я решил провести собственный анализ самых популярных публикаций на Хабре за январь 2025 года.
Для сбора данных я использовал свой парсер на Node.js. Работать пришлось напрямую с HTML, так как скрытого API Хабра я не нашёл. К счастью, внутри HTML разметки каждой статьи находится JSON с ключевыми параметрами: автор, дата, просмотры, рейтинг — это упростило парсинг.
Я обработал все статьи, опубликованные в январе, но в итоговый список попали только те, что набрали более 30 тысяч просмотров или рейтинг выше +30.
Чтобы объективно определить, какие статьи были самыми популярными, мне нужно было собрать как можно больше данных о каждой публикации. Для этого мой парсер на Node.js извлекал следующие параметры:
Идентификатор публикации.
Дата и время публикации — чтобы точно определить, какие статьи вышли в январе 2025 года.
Тип публикации — статья или новость. Это новый параметр, который я добавил в этот раз.
Полное имя автора, его имя пользователя и специализация.
Корпоративный блог или частная публикация.
Название статьи.
Хабы и потоки — помогают выявить категории, которые были наиболее востребованы. Но в анализе сложно использовать.
Краткое описание.
Просмотры — сколько раз статью открывали.
Комментарии — активность обсуждений.
Закладки — показатель, насколько материал ценен в долгосрочной перспективе.
Рейтинг статьи — итоговая оценка публикации.
Голоса "за" и "против" — детализируют влияние аудитории на рейтинг.
Почему выборка ограничена популярными статьями
Несмотря на то, что парсер обрабатывал все публикации января 2025 года, в финальную выборку вошли только статьи с рейтингом выше +30 или просмотрами более 30 тысяч. Это важное ограничение: его цель — выделить действительно резонансные материалы, а не просто все подряд.
Анализ данных с помощью Google Таблиц и QUERY
После сбора информации я использовал Google Таблицы для обработки данных. Встроенный инструмент QUERY позволил быстро отсортировать статьи по просмотрам, рейтингам, комментариям и другим параметрам.
После сбора информации я решил не ограничиваться сухими цифрами, а представить результаты в наглядной форме. Для этого я использовал фирменный стиль Хабра. На их бренд-ресурсе нашёл логотип, фирменные цвета и рекомендации по оформлению. Это позволило оформить визуализацию так, чтобы она органично смотрелась в стиле Хабра.
Облако слов
Один из самых удобных способов показать главные темы месяца — облако слов. Я использовал Python и библиотеку wordcloud, чтобы сгенерировать изображение с наиболее часто встречающимися словами в заголовках популярных статей. Для чистоты данных удалил стоп-слова (предлоги, союзы, служебные части речи). В результате получилось наглядное представление трендов января 2025 года.
# pip install wordcloud numpy pillowimport sys
sys.stdout.reconfigure(encoding='utf-8')
import numpy as np
from PIL import Image
from wordcloud import WordCloud
import os
# Проверка наличия файловdefcheck_file(file_path):ifnot os.path.exists(file_path):
print(f"Ошибка: файл {file_path} не найден.")
exit()
check_file("generate_wordcloud.txt")
check_file("generate_wordcloud_stop-ru.txt")
check_file("habr.png")
# Загрузка данных
print("Загрузка текста...")
with open("generate_wordcloud.txt", "r", encoding="utf-8") as f:
text = f.read()
print("Размер текста: ", len(text))
print("Загрузка стоп-слов...")
with open("generate_wordcloud_stop-ru.txt", "r", encoding="utf-8") as f:
stopwords = set(f.read().splitlines())
print("Количество стоп-слов: ", len(stopwords))
print("Загрузка маски...")
mask = np.array(Image.open("habr.png").convert("L"))
print("Размер маски: ", mask.shape)
# Создание облака словtry:
print("Создание облака слов...")
wordcloud = WordCloud(
width=1306,
height=741,
background_color="white",
stopwords=stopwords,
mask=mask,
contour_width=3,
contour_color="#629FBC",
colormap="viridis",
).generate(text)
except Exception as e:
print("Ошибка при создании облака слов: ", str(e))
exit()
# Сохранение результата
output_file = "generate_wordcloud_v1.png"
print(f"Сохранение облака слов в файл {output_file}...")
wordcloud.to_file(output_file)
print("Готово!")
Результаты анализа: новости
Облако топ новостей по частоте
Топ просмотров новостей за январь 2025:
Топ просмотров новостей на Хабре в январе 2025 года возглавило исследование о влиянии кофе на деменцию. Значительное внимание привлекла серия новостей о сбоях в работе Рунета, их причинах и последствиях, а также о мерах РКН. Пользователи активно следили за новостями о прекращении работы Keenetic в РФ, о рекламе на YouTube, об удалении приложений "Яндекс" Воложем, а также о политике Microsoft в отношении пиратства Windows 11. Кроме того, в топе были новости о проблемах с банковскими картами, утечке данных "Ростелекома", призыве Microsoft к обновлению до Windows 11 и ажиотаже вокруг DeepSeek.
В январе 2025 года на Хабре обсуждали проблемы с интернетом (сбои, замедления), блокировки и ограничения сервисов (YouTube, приложения «Яндекс», Keenetic), обновление Windows, пиратство, а также новые подходы к платным сервисам (Canon). Актуальность имели вопросы ИИ (DeepSeek) и закрытия проекта фриланса (Хабр Фриланс). Также пользователи интересовались влиянием кофе на здоровье и кибербезопасностью.
Топ новостей Хабра за январь 2025 года возглавляет новость о новой архитектуре нейросетей Google Titan, наряду с проблемами Рунета и их последствиями. Пользователей волновали новости об отношении Microsoft к пиратству Windows 11, действиях Воложа после ухода из "Яндекса", а также о засилье ИИ-контента в Google. Среди тем также присутствовали успехи SpaceX, проблемы Keenetic в РФ и закрытие Хабр Фриланс. Кроме того, в топ попали новости о замедлении YouTube, необычном проекте с синтезатором Yamaha, новой российской игре в Steam, платной функции веб-камеры от Canon и исследование о влиянии кофе на деменцию.
Топ Хабра в январе захватили нейросети и их применение, особенно DeepSeek и ChatGPT, а также темы заработка: отопление через майнинг, маркетплейсы и зарплаты в IT. Пользователи интересовались практическими вопросами: зарядкой аккумулятора, установкой ИИ, кэшированием YouTube. Также популярными были статьи о личном опыте в IT, саморазвитии, и даже необычные темы, вроде туалетов в самолётах и переработки металлолома.
В январе 2025 года наибольшее обсуждение вызвали статьи на Хабре, затрагивающие будущее IT: влияние возраста на карьеру, возможности ChatGPT и зарплатные ожидания. Активно обсуждали практические вопросы, такие как зарядка аккумулятора и банковские слияния, а также неоднозначные темы, как отказ от S.O.L.I.D принципов и споры об UX. Внимание привлекали и размышления об СДВГ, грамотности и, конечно, развитии нейросетей, в частности DeepSeek, а также мнения о влиянии ChatGPT на молодёжь.
Пользователи Хабра активно сохраняли статьи, ориентированные на практическое применение знаний: от основ работы интернета и изучения языка C, до установки ИИ-моделей, подборки ИИ-инструментов и создания собственной операционной системы. Значительный интерес вызвали темы карьерного развития в IT, понимание асинхронного кода и принципов SOLID, а также методы ускорения YouTube. Закладки также получили статьи о майнинге, психологии преодоления трудностей и личном опыте в IT.
Топ рейтинга Хабра в январе 2025 года демонстрирует интерес к разоблачениям: сговор менеджеров, бэкдоры в камерах, а также критику ООП и S.O.L.I.D. принципов. Популярностью пользовались статьи о технологических вызовах: ремонт Теслы, взлом Xbox, запуск советского процессора, создание эмуляторов и развлечения с ассемблером. В рейтинге отметились и размышления о будущем IT, личные истории, как удаление аденомы простаты, и даже теории достижения AGI.
В январе 2025 года на Хабре в топе авторов оказались как prolific-писатели, например, Денис из информационной службы Хабра, так и авторы с меньшим количеством публикаций, но с высоким откликом, такие как @NeyroEntuziast и Слава Рюмин. Выделяются Вячеслав Голованов с научпопом и @Sivchenko_translate, а также Павел Комаровский, показавшие высокие рейтинги. Несколько авторов, в том числе Aragorn, Andrei Chmelev и Data Secrets, также заслужили признание благодаря сочетанию просмотров и закладок.
Денис, @denis-19 / Информационная служба Хабра 19 публикаций в январе 2025, 65 053 в среднем просмотров на статью, 576 суммарное количество закладок, 33 средний рейтинг на статью
(Алексей), @NeyroEntuziast / Не гадьте в карму, лучше пишите, в чём не согласны 5 публикаций в январе 2025, 77 657 в среднем просмотров на статью, 1 098 суммарное количество закладок, 48 средний рейтинг на статью
Danila Simonov, @ElKornacio / IT Entrepreneur 4 публикации в январе 2025, 21 402 в среднем просмотров на статью, 264 суммарное количество закладок, 29 средний рейтинг на статью
Слава Рюмин, @slava_rumin / Делаем блоги для бизнеса, мой блог: упал, поднялся 4 публикации в январе 2025, 103 090 в среднем просмотров на статью, 403 суммарное количество закладок, 62 средний рейтинг на статью
Aragorn, @Lord_of_Rings / Дунадан — северный странник 3 публикации в январе 2025, 29 109 в среднем просмотров на статью, 312 суммарное количество закладок, 35 средний рейтинг на статью
@PatientZero / Переводчик-фрилансер 3 публикации в январе 2025, 10 039 в среднем просмотров на статью, 197 суммарное количество закладок, 49 средний рейтинг на статью
@Sivchenko_translate 3 публикации в январе 2025, 18 775 в среднем просмотров на статью, 212 суммарное количество закладок, 77 средний рейтинг на статью
Александр, @AlexKMK CTO в GFN CIS 3 публикации в январе 2025, 8 465 в среднем просмотров на статью, 319 суммарное количество закладок, 65 средний рейтинг на статью
Вячеслав Голованов, @SLY_G / Научпоп. Проповедую в храме науки. 3 публикации в январе 2025, 97 790 в среднем просмотров на статью, 67 суммарное количество закладок, 35 средний рейтинг на статью
Олег Сивченко, @OlegSivchenko / Переводчик, PM, автор, просветитель-любитель 3 публикации в январе 2025, 5 268 в среднем просмотров на статью, 93 суммарное количество закладок, 38 средний рейтинг на статью
Павел Комаровский, @RationalAnswer / Рационалист 3 публикации в январе 2025, 33 822 в среднем просмотров на статью, 303 суммарное количество закладок, 77 средний рейтинг на статью
Andrei Chmelev, @andry36 / Senior Full Stack Engineer / Tech Lead 2 публикации в январе 2025, 23 282 в среднем просмотров на статью, 407 суммарное количество закладок, 41 средний рейтинг на статью
Data Secrets, @DataSecrets / Журнал о DS и ML. Наш канал: t.me/data_secrets 2 публикации в январе 2025, 22 496 в среднем просмотров на статью, 163 суммарное количество закладок, 54 средний рейтинг на статью
Dmitriy Zagorodnyuk, @xjr358 / Old hardware, probability theory & wine 2 публикации в январе 2025, 9 135 в среднем просмотров на статью, 32 суммарное количество закладок, 63 средний рейтинг на статью
Sergei Kushnirenko, @dalerank / Люблю (ш)кодить, алгоритмы и старые авто. 2 публикации в январе 2025, 4 378 в среднем просмотров на статью, 84 суммарное количество закладок, 38 средний рейтинг на статью
Корпоративные блоги
Среди корпоративных блогов в январе 2025 года лидируют @ru_vds с большим количеством публикаций и @Bright_Translate с высокими показателями просмотров и закладок. Отмечены также Антон @k0mar0v и Анастасия Ербанова, демонстрирующие стабильный интерес аудитории. Анатолий Ализар выделяется высокими средними просмотрами, а Александр Семенов и Дмитрий Брайт - высокими средними рейтингами. Заслуживают внимания и @DAN_SEA Алексей Костенков и Богдан, показавшие хорошие результаты.
@ru_vds / Пользователь 11 публикаций в январе 2025, 13 115 в среднем просмотров на статью, 1 032 суммарное количество закладок, 66 средний рейтинг на статью
Дмитрий Брайт, @Bright_Translate / Переводчик 8 публикаций в январе 2025, 21 162 в среднем просмотров на статью, 952 суммарное количество закладок, 75 средний рейтинг на статью
Антон, @k0mar0v / Гик, фанат электроники, компьютеров и аниме 6 публикаций в январе 2025, 11 881 в среднем просмотров на статью, 282 суммарное количество закладок, 47 средний рейтинг на статью
Анастасия Ербанова, @erbanovanastasia / Технический писатель 5 публикаций в январе 2025, 12 563 в среднем просмотров на статью, 100 суммарное количество закладок, 53 средний рейтинг на статью
@DAN_SEA / Технологии разработки программного обеспечения 4 публикации в январе 2025, 9 859 в среднем просмотров на статью, 213 суммарное количество закладок, 60 средний рейтинг на статью
Алексей Костенков, @Erwinmal / Рептилоид 4 публикации в январе 2025, 12 223 в среднем просмотров на статью, 185 суммарное количество закладок, 63 средний рейтинг на статью
Богдан, @bodyawm / Программист, железнячник. Донаты идут на контент! 4 публикации в январе 2025, 15 127 в среднем просмотров на статью, 116 суммарное количество закладок, 64 средний рейтинг на статью
Дмитрий Домлоджанов, @DimDimDimDimDim 4 публикации в январе 2025, 8 500 в среднем просмотров на статью, 93 суммарное количество закладок, 47 средний рейтинг на статью
Александр Шилов, @El_Gato_Grande / Технический автор 3 публикации в январе 2025, 8 729 в среднем просмотров на статью, 195 суммарное количество закладок, 56 средний рейтинг на статью
Анатолий Ализар, @alizar / автор, фрилансер 3 публикации в январе 2025, 23 928 в среднем просмотров на статью, 352 суммарное количество закладок, 54 средний рейтинг на статью
SberTeam, Сбер / Пользователь 2 публикации в январе 2025, 3 518 в среднем просмотров на статью, 66 суммарное количество закладок, 34 средний рейтинг на статью
Александр Семенов, @shiru8bit / Узкий специалист широкого профиля 2 публикации в январе 2025, 6 413 в среднем просмотров на статью, 46 суммарное количество закладок, 75 средний рейтинг на статью
@Guren302 2 публикации в январе 2025, 18 617 в среднем просмотров на статью, 58 суммарное количество закладок, 69 средний рейтинг на статью
Андрей Ларин, @engine9 / Дизайнер, энтузиаст 3Д графики, влюблен в LINUX. 2 публикации в январе 2025, 7 231 в среднем просмотров на статью, 79 суммарное количество закладок, 62 средний рейтинг на статью
Валентин Холмогоров, @Holmogorov / Аналитик, редактор, писатель 2 публикации в январе 2025, 5 729 в среднем просмотров на статью, 44 суммарное количество закладок, 55 средний рейтинг на статью
Заключение
Анализ популярных публикаций показал явную доминирующую роль новостей о сбоях в Рунете, а также о развитии ИИ. Статьи, посвященные практическому применению ИИ (DeepSeek, ChatGPT), отоплению майнингом и заработку, также получили большой интерес. Форматы, которые привлекали аудиторию, отличались практической направленностью и захватывающим сюжетом. Новости, как правило, привлекали внимание оперативной информацией, тогда как статьи ценились за подробное освещение темы.
Влияние типа публикации на популярность заметно: новости о сбоях Рунета привлекли значительно больше просмотров, чем статьи о нейросетях, несмотря на высокий рейтинг последних. Это демонстрирует, что актуальность и срочность новостей значительно влияют на выбор пользователя.
Приглашаю к обсуждению в комментариях: поделитесь своим мнением о результатах анализа!